ICLRJul, 2016

DSD:用于深度神经网络的稠密 - 稀疏 - 稠密训练

TL;DR通过提出 DSD 训练流程,即 Dense-Sparse-Dense(DSD)的训练方法,对深度神经网络进行正则化,以实现更好的优化性能;实验证明,DSD 训练可以提高各种神经网络模型(如 CNN、RNN 和 LSTM)在图像分类、标题生成和语音识别等任务中的性能,并且可以在不改变网络架构或引入任何推理开销的情况下使用。