NIPSDec, 2015

循环神经网络中基于理论的 Dropout 应用

TL;DR该论文介绍了一种基于变分推断的 dropout 新技术,并探讨了如何将其应用到 LSTM 和 GRU 模型中,这种方法表现优于现有技术,并在语言模型中取得了最佳结果。