Mar, 2019

分布式稀疏全局约简分层 SGD 算法

TL;DR为了减少大规模机器学习应用中分布式平台训练过程中的通信成本,我们提出了一种分布式层次平均随机梯度下降(Hier-AVG)算法,该算法采用局部平均,通过引入不频繁的全局平均来实现。实验结果表明,与其他算法相比,采用 Hier-AVG 可以实现更快的训练结果,而仍能达到更好的测试精度。