Jul, 2022
解释我的惊讶:通过预测不确定结果学习高效的长期记忆
Explain My Surprise: Learning Efficient Long-Term Memory by Predicting Uncertain Outcomes
Artyom Sorokin, Nazar Buzun, Leonid Pugachev, Mikhail Burtsev
TL;DR本文提出了一种新的训练方法 MemUP,可以在不需要同时反向传播整个序列梯度的情况下学习长期依赖关系,用于训练 LSTM 网络表现表现良好,并需要存储更少的中间数据。