Sep, 2019

用于修剪非常深的神经网络的全局稀疏动量 SGD

TL;DR本文提出了一个基于动量优化(momentum-SGD-based optimization)的优化方法,用于压缩 DNN 模型,从而消除冗余参数,减少网络的复杂度。该方法采用全局压缩策略来自动找到层次的稀疏率,经过优化后能够无需耗费时间进行重训练的过程,具有更好的压缩效果和训练能力。