ACLJul, 2017

使用密集连接循环神经网络改善语言模型

TL;DR本文提出将高度连接层引入循环神经网络中,对其在 Penn Treebank 语言建模任务中的性能进行评估,结果显示与标准 2 层 LSTM 模型相比,可以减少 6 倍的参数,使用仅几层堆叠的高度连接层即可显著降低困惑度。