May, 2017

TernGrad: 用三值梯度减少分布式深度学习通信

TL;DR本文提出TernGrad,使用三元梯度来加速数据并行的分布式深度学习,结果表明可在不损失准确率的前提下缩减通信时间并提高收敛性能,使得多种深度神经网络的速度显著提升。