AAAIOct, 2020

稀疏神经网络中的梯度流与中奖彩票方法

TL;DR本文研究稀疏神经网络的训练,并分析了从随机初始化开始训练稀疏神经网络的不良表现以及 Lottery Tickets 和 Dynamic Sparse Training 的例外情况。作者发现稀疏神经网络在初始化时梯度流较差,使用稀疏感知的初始化对性能至关重要。DST 方法可以显著提高训练期间的梯度流,而 LTs 的成功则在于重新学习了它们基于修剪的解决方案 —— 但这是以学习新解决方案为代价的。