Jan, 2018

嵌套 LSTMs

TL;DR通过不断嵌套而不是简单堆叠的方式,我们提出了一种新的基于多层内存的循环神经网络体系结构 ——Nested LSTMs。我们在各种字符级语言建模任务中使用 Nested LSTMs 的内存单元,其性能优于使用相似参数的多层 LSTMs 和单层 LSTMs,并且 LSTM 的内部记忆相对于堆叠的 LSTM 的高层单元来说更能学习到长期的依赖关系。