Dec, 2023

在线变分顺序蒙特卡洛

TL;DR在该研究中,我们使用基于粒子方法和变分推断的变分序贯蒙特卡洛(VSMC)方法,在时间上分布了 VSMC 代理 ELBO 的梯度的近似,从而实现了面向数据流的在线学习,能够高效地进行参数估计和粒子提议适应。同时,我们提供了与数据量趋于无穷大时该算法收敛性质的严格理论结果,以及在批处理设置中的出色收敛性和实用性的数值说明。