ICLRMar, 2017

LSTM 网络的分解技巧

TL;DR本文提出利用矩阵因子分解和矩阵划分两种方法来降低参数数量和加速训练大型 LSTM 网络的方法,并成功实现了在参数数量显著减少情况下接近最先进水平的困惑度。