Jun, 2018

ATOMO: 原子稀疏化通信高效学习

TL;DR本文提出了一种通用框架ATOMO,用于进行原子稀疏化,控制梯度更新的传输,加快分布式训练,该方法包括元素分解、奇异值分解和傅里叶分解等,通过稀疏化神经网络梯度的奇异值分解可以显著提升分布式训练速度。