Jul, 2020

CSER: 带错误重置的通信有效 SGD

TL;DRCSER 算法结合高压缩率技术,引入了误差重设和梯度以及模型的部分同步,可将 CIFAR-100 的分布式训练加速近 10 倍,ImageNet 加速 4.5 倍。