ICLRNov, 2015

MuProp: 随机神经网络的无偏反向传播

TL;DRMuProp 是一种无偏的梯度估计器,用于训练包含离散采样操作的随机网络,并通过控制变量基于平均场网络的一阶泰勒展开来减少方差,其结果是无偏且经过良好的验证。