May, 2019
具有误差反馈的通信高效分布式块动量 SGD
Communication-Efficient Distributed Blockwise Momentum SGD with
Error-Feedback
TL;DR提出了一种基于Nesterov的动量的分布式压缩的SGD方法,通过两种方式压缩梯度并将梯度分块,每个梯度块都以1位格式进行压缩和传输,并实现了近32倍的通信降低,实验表明该方法与精度相同的动量SGD收敛速度相同,并在分布式ResNet训练中达到与全精度梯度动量SGD相同的测试精度,而时间缩短了46%。