Oct, 2020

数据并行 SGD 的自适应梯度量化

TL;DR通过研究发现深度模型的梯度统计在训练过程中发生变化,于是引入两种自适应量化方案 ALQ 和 AMQ,显著改善了 CIFAR-10 和 ImageNet 的验证准确率,且更具鲁棒性。