BriefGPT.xyz
Mar, 2019
分布式稀疏全局约简分层SGD算法
A Distributed Hierarchical SGD Algorithm with Sparse Global Reduction
HTML
PDF
Fan Zhou, Guojing Cong
TL;DR
为了减少大规模机器学习应用中分布式平台训练过程中的通信成本,我们提出了一种分布式层次平均随机梯度下降(Hier-AVG)算法,该算法采用局部平均,通过引入不频繁的全局平均来实现。实验结果表明,与其他算法相比,采用Hier-AVG可以实现更快的训练结果,而仍能达到更好的测试精度。
Abstract
Reducing
communication overhead
is a big challenge for large-scale distributed training. To address this issue, we present a hierarchical averaging
stochastic gradient descent
(Hier-AVG) algorithm that reduces gl
→