MMFeb, 2019

非独立同分布数据分布式异步训练的全局动量梯度调度

TL;DR提出了一种利用全局动量和局部平均梯度的梯度调度算法 GSGM 来处理非 IID 数据的分布式异步训练问题,并进行了一系列实验,结果表明 GSGM 算法相对于同类算法可以提高 20% 的训练稳定性并略微提高准确性,同时在稀疏数据分布的情况下可以提高 37% 的训练稳定性,在 30 个计算节点的情况下仍表现出较好的收敛性能,对不同程度的非 IID 数据鲁棒性强。