ACLAug, 2019

低秩矩阵分解在 LSTM 模型压缩中的有效性研究

TL;DR本文提出了一种将低秩矩阵分解算法应用于 LSTM 网络不同递归操作的方法,探讨了在不同自然语言处理任务和模型组成部分中的有效性,并发现加性递归比乘性递归更重要。两种设置下我们进行了比较:1)压缩语言模型中核心 LSTM 递归,2)压缩在三个下游自然语言处理任务中评估 ELMo 的 biLSTM 层。