Jul, 2019

在分布式异步环境下调控动量

TL;DR提出了一种名为 DANA 的技术,旨在解决分布式异步训练的梯度走样问题,可以加速深度神经网络的训练过程且不影响最终精度。该方法在 CIFAR 和 ImageNet 数据集上表现出比现有方法更好的性能。