ICMLJul, 2021

结构性随机梯度 MCMC

TL;DR用一种新的非参数泛化逼近方法代替 VI,包含了一种 Langevin-type 算法,其中一部分潜变量是从 Markov 链的早期样本中平均的,以控制地打破统计相关性,从而使链更快混合。通过在 ResNet-20 上对 CIFAR-10,SVHN 和 FMNIST 进行测试,我们发现与 SG-MCMC 和 VI 相比,在收敛速度和 / 或最终准确性方面都有所提高。