BriefGPT.xyz
Ask
alpha
关键词
bayesian linear regression
搜索结果 - 5
可微退火重要性采样与梯度噪声的风险
提出了 Differentiable AIS(DAIS)算法,是 AIS 算法的一种变种,具备可导性,并能够进行小批量梯度。DAIS 在贝叶斯线性回归问题中是一致的,并提供亚线性收敛率。然而,针对大规模数据集的随机 DAIS 可能无法达到后
→
PDF
3 years ago
ICML
基于模型的强化学习在连续控制中的后验采样
本文研究了连续状态动作空间中强化学习的基于模型的后验抽样(PSRL),提出了第一个后验抽样的遗憾上界,并开发了 MPC–PSRL 算法来选择动作,通过贝叶斯线性回归捕获模型中的不确定性,在基准连续控制任务中实现了最先进的样本效率,并与无模型
→
PDF
4 years ago
函数空间中变分推断的理解
本文提出直接近似贝叶斯模型函数空间或预测后验分布的方法,并指出了使用 Kullback-Leibler divergence 方法的优劣,提出了基于 Bayesian linear regression 的 benchmark 方法来评估预
→
PDF
4 years ago
高维贝叶斯变量选择的计算复杂度
本文研究高维贝叶斯线性回归的计算复杂度,介绍了一种截尾稀疏先验变量选择方法,通过 Metropolis-Hastings 算法,保证了变量选择的一致性和快速混合。
PDF
9 years ago
ICML
拟牛顿法:一个新方向
该研究论文提出了新的概念,即将许多拟牛顿方法解释为贝叶斯线性回归的近似,为传统算法的某些缺点提供了解释,并展现了一种新的非参数拟牛顿方法,它能够以类似于以前版本的计算成本来更有效地利用可用的信息。
PDF
12 years ago
Prev
Next