Apr, 2020

具有误差反馈的量化 Adam

TL;DR本文提出一种分布式变体的自适应随机梯度方法用于训练深度神经网络,并通过梯度量化和权重量化等量化方案以及误差反馈技术来降低通信成本和量化误差,实现在随机非凸的场景下达到一阶稳定点,该方法在深度神经网络训练中取得了良好实验结果。