AAAIJun, 2020

STL-SGD:针对阶段通信周期的本地 SGD 加速

TL;DR本文提出了一种称为 STL-SGD 算法的分布式机器学习算法,通过逐渐增加通信周期来降低通信复杂度并加速收敛速度,证明其具有与 mini-batch SGD 相同的收敛速度和线性加速,且在强凸或满足 Polyak-Lijasiewicz 条件的情况下具有较大的优势。