Oct, 2020

线性收敛误差补偿 SGD

TL;DR本文提出了一种统一的分析分布式 SGD 各种变体的方法,涵盖了不同的量化 SGD、误差补偿 SGD 和延迟更新 SGD 变体,并通过一个定理推导了其所有方法的复杂度结果。在此基础上,我们开发了 16 种新的方法,其中包括第一种基于误差反馈和梯度差分量化的 EC-SGD-DIANA 方法和第一种具有误差反馈和方差缩减的分布式随机方法 EC-LSVRG-DIANA。