BriefGPT.xyz
Ask
alpha
关键词
model mismatch
搜索结果 - 2
卷积贝叶斯滤波
通过引入一个附加事件来规定不等条件,我们将条件概率转换成类似于卷积的特殊积分,实现了传统贝叶斯滤波的更普适框架,称之为卷积贝叶斯滤波。该框架包含了标准贝叶斯滤波作为一种特殊情况,当不等条件的距离度量选取为狄拉克函数时。通过选择不同类型的不等
→
PDF
3 months ago
ICML
强化学习的鲁棒性策略梯度方法
开发了具有全局最优性保证和复杂度分析的政策梯度方法,用于处理模型不匹配下的鲁棒强化学习,提出了鲁棒策略梯度和平滑的鲁棒策略梯度方法,并将方法推广到广泛的非模型设置下,提供了仿真结果证明了方法的鲁棒性。
PDF
2 years ago
Prev
Next