ICLRJul, 2018

ARM: 用于随机二值网络的增广 - 强化 - 合并梯度

TL;DR本篇论文提出了一种叫做 ARM 估计量的反向传播算法,用于通过随机二进制层进行梯度反向传播,具有无偏差,低方差和低计算复杂性的特点。ARM 估计器通过变量增广、REINFORCE 和再参数化实现自适应方差缩减,通过公共随机数合并两个期望值。ARM 估计器的方差缩减机制还可归因于增广空间中的对称抽样或使用增广空间中的最优反对称 “自控” 基线函数以及一起使用 REINFORCE 估计器。实验结果表明,ARM 估计器在具有一个或多个随机二进制层的离散潜变量模型的自动编码变分推断和最大似然估计中提供了最先进的性能。