包容性KL最小化:一种Wasserstein-Fisher-Rao梯度流视角
本文提出了用于优化的通用变分推理算法,它是梯度下降法的一种自然补充,可以通过一种函数梯度下降来最小化KL距离,从而迭代地传输一组粒子以匹配目标分布。经过在各种真实世界模型和数据集上的实证研究,我们的方法与现有的最先进的方法相竞争。我们方法的推导基于一个新的理论结果,它连接了平滑转换下KL距离的导数与Stein's恒等式以及最近提出的核化的Stein距离,这也具有独立的兴趣。
Aug, 2016
该研究论文介绍了一种基于Wasserstein梯度流的扩散过程的新近似推理方法,该方法直接在连续函数空间中计算Wasserstein梯度流,并具有可比拟的过滤能力。
Jun, 2018
本研究提出了一种新的变分推断方法,通过最小化切片Wasserstein距离来近似非规范化分布并使用神经网络对变分分布进行逼近。我们还提供了理论性分析,并用合成和实际数据进行了实验验证。
Jul, 2022
本文提出一种名为PFG的新粒子变分推断算法,采用一种 functional regularization 方法,支持更广泛的函数类,同时具有更好的可伸缩性和对恶劣条件分布的适应性,在渐进意义下连续地收敛于KL散度。
Nov, 2022
本文研究了基于梯度流的采样方法的设计要素,主要包括能量函数、度量、和用于算法推导的梯度流的数值近似。首先,我们展示了Kullback-Leibler散度作为能量函数的独特性质,即由它引导的梯度流与目标分布的标准化常数无关。其次,我们从不变性的角度研究了度量的选择,引入了一种放松的仿射不变性,构建了各种仿射不变的Wasserstein和Stein梯度流。最后,基于高斯近似的梯度流方法被提出,并与参数变分推断衍生的梯度方法建立了联系,理论和数值上研究了它们的收敛性。
Oct, 2023
该论文介绍了一种称为广义Wasserstein梯度下降(GWG)的粒子变分推断方法框架,基于KL散度的广义Wasserstein梯度流,可视为具有更广泛正则化器类的函数梯度方法,展示了GWG具有强大的收敛性保证,通过实验证明了该框架在模拟和真实数据问题上的有效性和高效性。
Oct, 2023
Variational inference (变分推断) can be optimized using Wasserstein gradient descent methods to improve efficiency and alignment of variational parameters with the true posterior.
Oct, 2023
本文介绍了变分推断和Wasserstein梯度流之间的联系,通过将Bures-Wasserstein梯度流转化为欧几里德梯度流,并使用路径导数梯度估计器生成梯度场,同时提供了一种新的梯度估计方法适用于$f$-divergences的拓展。
Oct, 2023
使用序贯蒙特卡洛采样估计更全面的KL散度的梯度,提出了SMC-Wake方法,其使用了编码器网络进行已摊销的变分推断,以更准确地拟合后验分布的变分分布。
Mar, 2024
本研究解决了在约束域中进行采样的难题,提出了一种新的功能梯度变分推断方法,称为约束功能梯度流(CFG),并为其引入了梯度流的边界条件。通过理论分析和实验验证,展示了该方法在总变差下具有可证明的连续时间收敛性,提供了一种有效的处理约束域采样的框架。
Oct, 2024