Jul, 2017

用摊余式 Stein 变分梯度下降学习绘制样本

TL;DR我们提出了一种简单的算法,用于训练随机神经网络从给定的目标分布中绘制样本,以进行概率推断。我们的方法基于按照 Stein 变分梯度方向(Liu & Wang,2016)调整神经网络参数,从而最大程度地减少与目标分布的 KL 散度。这种方法适用于任何由其未归一化密度函数指定的目标分布,并且可以训练任何可微分的参数结构。我们用许多应用程序演示了我们的方法,包括具有表现力编码器的可变分自编码器(VAE)以建模复杂的潜在空间结构,以及 MCMC 采样器的超参数学习,这允许贝叶斯推断在看到更多数据时自适应地改善。