May, 2019

MATCHA: 基于匹配分解采样的分布式随机梯度下降加速算法

TL;DR本文研究了分布式训练中通常遇到的误差-运行时权衡问题,提出了MATCHA算法,该算法能够在任意网络拓扑结构下实现误差-运行时权衡的双赢,并且通过将拓扑结构分解为匹配来实现节点之间的并行交流。通过实验验证,MATCHA算法在达到相同的训练损失时比基本的分布式随机梯度下降算法少花费高达5倍的时间。