Oct, 2023

STANLEY:基于随机梯度异向 Langevin 动力学的能量模型学习

TL;DR我们在本文中提出了 STANLEY,这是一种用于高维数据采样的随机梯度非各向同性 Langevin 动力学方法。通过能量基建模,我们介绍了一种用于改善采样数据质量的端到端学习算法,同时考虑了 EBM 训练中未知的归一化常数和 MCMC 方法。我们的方法 STANLEY 是一种通过我们新提出的 MCMC 方法来训练能量基模型的优化算法,并通过实验证明了其有效性。