理解随机自然梯度变分推断
提出了一种基于随机梯度方法的变分推断新方法,不仅利用变分参数空间的几何性质,而且即使对于非共轭模型也可以产生简单的闭合式更新,该方法也具有收敛速率分析,即使用于非凸目标的随机镜像下降。在多种问题上,实验证明新算法在该框架中导出可以导致最先进的结果。
Oct, 2015
本文提出CVI算法,将共轭计算和随机梯度结合,应用于大量模型并证明其收敛性,与忽略模型共轭结构的方法相比,我们的算法收敛速度更快。
Mar, 2017
我们提出了一种简单且通用的标准重参数化梯度估计变体,以用于变分证据下限。通过删除与评估参数有关的分数函数的导数,我们将产生一个无偏梯度估计器,其方差随着近似后验接近精确后验逐渐逼近零。我们从理论和实证方面分析了这种梯度估计器的行为,并将其推广到更复杂的变分分布中,例如混合分布和重要性加权后验。
Mar, 2017
本文探讨了利用自然梯度方法在非共轭随机模型环境下的超参数学习,结果显示自然梯度方法可显著提高性能和效率并已被集成于GPflow软件包中。
Mar, 2018
使用半隐式变分推断方法(SIVI)扩展了通常使用的解析变分分布族, 可以将变分参数与灵活的分布混合. 这种混合分布可以采用任何密度函数来生成独立的随机样本, 并且在推理贝叶斯模型的后验概率方面与MCMC方法的精度相当.
May, 2018
提出了一种新的针对非可微密度模型的随机变分推断算法,通过对可微区域应用标准的重新参数化技巧、对边界区域应用流形采样,估计并得出梯度的高效率降低了方差并保持偏差的不变。
Jun, 2018
本文提出了一种基于 VarGrad 的无偏梯度估计方法,在概率变分推断中应用较广,并证明其比分数函数方法具有更低的方差和更优秀的计算性能。
Oct, 2020
本研究介绍了一种称为“确定性ADVI”的方法来解决MFVB的问题,并使用蒙特卡罗近似方法去优化其目标,相较于标准的MFVB,确定性ADVI能更准确地预测后验线性响应协方差,并在现实问题中表现更加可靠并具有更快的速度和更高的准确性。
Apr, 2023
本文提供了第一篇关于全黑箱变分推断的收敛性保证,特别是蒙特卡罗变分推断。作者通过与传统算法相比的分析,证明了使用鲁棒的变分族文件和负责的算法设计,特别是使用近端随机梯度下降,可以实现最强的已知收敛速率保证。
May, 2023
在完美变分族规范下,证明了带有控制变量的黑盒变分推断(BBVI),特别是附着着陆(STL)估计器,在几何(传统称为“线性”)速率下收敛。我们证明了STL估计器的梯度方差的二次界限,由此可以直接推出使用投影随机梯度下降的BBVI的收敛性。我们还改进了现有的关于常规闭式熵梯度估计器的分析,从而使其可以与STL估计器进行比较,并为两者提供明确的非渐近复杂性保证。
Jul, 2023