Feb, 2021

MARINA:使用压缩提升非凸分布式学习速度

TL;DR本文提出了一种新的、基于压缩梯度差异的分布式学习方法MARINA,并分别从理论和实践层面证明了该方法的优越性,特别是利用了偏梯度估计器和局部参与等特性。