理解 MCMC 动态作为 Wasserstein 空间上的流
基于动量的动力学方法的优化与采样机制的研究,其中涉及 Lie 群、变分优化、动量动力学与采样动力学,以及基于动量的动力学方法在曲面上的收敛性研究。
Mar, 2024
通过将优化方法扩展到 Wasserstein 空间中的 Riemannian manifold,我们提出了用于连续优化的随机梯度下降和随机方差减少梯度流,证明了这些梯度流的收敛速度,与 Euclidean 空间中的结果相匹配。
Jan, 2024
该论文介绍了一种称为广义 Wasserstein 梯度下降(GWG)的粒子变分推断方法框架,基于 KL 散度的广义 Wasserstein 梯度流,可视为具有更广泛正则化器类的函数梯度方法,展示了 GWG 具有强大的收敛性保证,通过实验证明了该框架在模拟和真实数据问题上的有效性和高效性。
Oct, 2023
通过几何 Langevin MCMC 从一个 Riemann 流形 M 上的 Gibbs 分布 dπ* 进行高效采样的任务,我们提出了一种在实践中可实现的算法,该算法涉及在随机高斯方向上计算指数映射。通过对几何 Euler-Murayama 方案的离散化误差进行界定,假设▽h 是 Lipschitz 的且 M 具有有界的切向曲率,我们的误差界限与欧几里得 Euler-Murayama 的误差相匹配,结合 Kendall-Cranston 耦合下的几何 Langevin 扩散的收缩保证,我们证明 Langevin MCMC 迭代在经过~O (ε^-2) 次步骤后,与 π* 之间的 Wasserstein 距离小于 ε,这与欧几里得 Langevin MCMC 的迭代复杂性相匹配。我们的结果适用于具有非凸 h 和具有负 Ricci 曲率的一般设置。在额外的假设下,即 Riemann 曲率张量具有有界导数且 π* 满足 CD (・,∞) 条件,我们分析了 Langevin MCMC 的随机梯度版本,并将其迭代复杂性限制在~O (ε^-2) 次。
Feb, 2024
本文介绍了变分推断和 Wasserstein 梯度流之间的联系,通过将 Bures-Wasserstein 梯度流转化为欧几里德梯度流,并使用路径导数梯度估计器生成梯度场,同时提供了一种新的梯度估计方法适用于 $f$-divergences 的拓展。
Oct, 2023
本研究探讨了基于欠阻尼 Langevin 扰动的 Markov 链采样器在具有凸平滑势能的高维目标中的效率。研究人员使用一个经典的二阶积分器,每次迭代只需要计算一次梯度,并证明了离散时间链本身的沃舍斯坦距离的无尺度压缩和总变差距离的收敛率与维度无关。同时还得到了 Metropolis 调整链和未调整链的非渐进沃舍斯坦和总变差的效率界以及浓度不等式。 特别地,对于未调整链,无论在一般情况下、势函数海森斯的 Lipschitz 情况下还是可分离目标的情况下,沃舍斯坦效率界都是 $\sqrt d/\varepsilon$,与其他动态 Langevin 或 HMC 方案的已知结果相符合。
Jul, 2020
本论文提出了一种基于 Wasserstein 空间梯度流、Fokker-Planck 方程和扩散过程的分析 mean field variational inference (MFVI) 算法的框架,旨在解决 MFVI 算法中的收敛问题。研究表明,此框架可以保证多种解决变分推断问题的算法的收敛性。
Oct, 2022
本文探讨不同近似推断方法(Markov chain Monte Carlo 和变分推断)的优缺点,并提出一种分布来衡量它们之间的差距,其示例介绍了如何从这个分布中采样,以便在现有方法(基于 Langevin 动力学和随机梯度变分推断)之间进行加权插值。
Jun, 2017
Variational inference (变分推断) can be optimized using Wasserstein gradient descent methods to improve efficiency and alignment of variational parameters with the true posterior.
Oct, 2023
本文从 Wasserstein 梯度流的角度探索基于粒子的变分推断方法,并在理论和实践上做出了贡献,揭示了现有方法的假设和关系,并提出了一个加速框架和一个基于开发理论的有原则的带宽选择方法,这些方法利用了 Wasserstein 空间的几何,实验结果表明了加速框架的改善收敛和带宽选择方法提高了样本准确性。
Jul, 2018