Jun, 2019

异构数据的分布式训练:连接中位数和基于平均值的算法

TL;DR本文研究介绍了两种分布式非凸优化算法:signSGD 和 medianSGD,并发现它们在数据异构的情况下是不收敛的。作者提出了一种梯度校正机制来消除梯度的平均值和中位数之间的差异,该方法保留了这些方法的良好性质,并实现了全局收敛。此外,该文中所提的梯度校正技术在其他估计平均值的场合也有独立的应用价值。