Nov, 2018

超级神经元:基于 FFT 的梯度稀疏化在深度神经网络的分布式训练中的应用

TL;DR使用稀疏性和基于范围的浮点表示方法,本文提出了一种新的梯度压缩框架,该框架在不影响准确性和收敛速度的情况下,显著提高了最流行的神经网络在大规模 GPU 集群上的可扩展性。