蒙特卡罗目标的双重重参数化梯度估计器
提供了一种简单而高效的计算持续性随机变量低方差梯度的方法,称为重新参数化技巧,但它并不适用于许多重要的连续分布。 本文通过隐式微分介绍了一种计算重新参数化梯度的替代方法,并证明了其对 Gamma,Beta,Dirichlet 和 von Mises 分布具有更广泛的适用性,并且实验表明所提出的方法比现有的梯度估计方法更快,更准确。
May, 2018
本文提出广义重参数化梯度,将此技术拓展到更大范围的变分分布,使用潜在变量的可逆变换,组合重参数化梯度和分数函数梯度得到新的 Monte Carlo 梯度,并在两个复杂的概率模型上展示了其高效性。
Oct, 2016
该研究提出了一种基于重要性采样和统计耦合的派生估计器,将分类变量重新参数化作为二进制序列,并进行 Rao-Blackwellization,结果表明该方法在离散潜变量训练中具有最先进的性能。
Jun, 2021
本研究提出了一种基于控制变量(control variate)方法,通过估计梯度样本的生成过程近似减少噪声梯度的方差,取得了多个数量级(20-2,000 倍)的优化效果提升,在非共轭多级层次模型和贝叶斯神经网络实验中证明了其有效性。
May, 2017
本研究提出了一种对 Gumbel-Softmax estimator 进行 Rao-Blackwellization 的方法,可在不增加函数评估数量的情况下减少方差,从而降低均方误差,并在两种无监督潜变量模型中得到了实证验证。
Oct, 2020
本文介绍了一种名为 DualVDT 的生成模型,该模型包括可变形自编码器中的双重重参数化变体机制,并基于潜变量评分的生成模型来显式地去噪。该模型还提出了一种潜在的注意力机制,以明确提取多元依赖性。实验证明这一模型具有先进的性能。
Mar, 2022
本文通过将控制变量与连续松弛相结合的方式来降低离散潜在变量的高方差梯度估计,并引入了一种在线调整松弛度的修改方法,实现了最先进的方差降低并加速了生成建模任务中的收敛。
Mar, 2017
提出了一种新的针对非可微密度模型的随机变分推断算法,通过对可微区域应用标准的重新参数化技巧、对边界区域应用流形采样,估计并得出梯度的高效率降低了方差并保持偏差的不变。
Jun, 2018
针对深度离散潜变量模型中的梯度计算和步长适应问题,本论文提出了利用数据增广和边缘化技术,得到分块对角 Fisher 信息矩阵及其逆的深度潜在狄利克雷分配表示,并利用该矩阵和随机梯度马尔科夫链蒙特卡罗方法,提出了主题 - 层适应性的随机梯度里曼蒙特卡罗方法,可全局学习所有层和主题的全局参数,实现了在大数据集上的最新成果。
Jun, 2017