BriefGPT.xyz
Ask
alpha
关键词
markovian score climbing
搜索结果 - 3
ICML
可微退火重要采样最小化初始分布与目标分布之间的 Jensen-Shannon 散度
DAIS 是一种可微分的持续退火重要性采样方法,它通过最小化初始和目标分布之间的对称 KL 散度来进行变分推断。通过实证评估其在合成和真实数据上作为变分分布的有用性,发现与标准 VI、重要性加权 VI 和马尔科夫分数爬升相比,它常常能提供更
→
PDF
a month ago
风险敏感随机最优控制的 Rao-Blackwellized Markovian Score Climbing
该论文介绍了一种新颖的方法,通过从条件粒子滤波器中抽取样本,将风险敏感的随机控制看作马尔科夫评分上升问题,提供了渐进无偏估计的梯度优化策略,避免了显式值函数学习,通过在随机动态系统的数值基准测试中展示其有效性,应用于学习神经非高斯反馈策略。
PDF
7 months ago
马尔可夫分数攀登:KL (p||q) 变分推理
本文介绍了一种可靠的使用随机梯度下降最小化包含 KL 散度的简单算法 Markovian score climbing (MSC),它以不偏的方式收敛于包含 KL。对贝叶斯 probit 回归进行分类以及针对金融数据的随机波动率模型演示了
→
PDF
4 years ago
Prev
Next