WWWFeb, 2019

通过 Count-Sketches 压缩梯度优化器

TL;DR通过引入线性草图的压缩辅助变量方法,可以在减小成本的情况下,实现与原算法相同的性能,这在大规模深度学习模型的训练中具有潜在的应用价值。