ICLRSep, 2018

移动设备神经语言模型自适应修剪

TL;DR本文通过在 quasi-recurrent neural networks (QRNNs) 基础上应用剪枝技术来提供一种选择不同操作点的 “旋钮”,并提出一种使用可忽略量的内存恢复一些 perplexity 的简单技术,并在树莓派上考虑 perplexity 和能耗两方面的实证评估,证明了哪种方法能提供最佳的 perplexity - 能耗操作点,其中一种技术能够在一个操作点上相对于现有技术,提供 40%的能量节省和仅 17%的相对 perplexity 增加。