ICLRApr, 2023

自适应饱和循环神经网络:用更少的不稳定性记住更多

TL;DR本文研究借助正交参数化技术解决循环神经网络中的梯度弥散问题,提出了一种 Adaptive-Saturated RNNs (ASRNN) 变种,它动态调整饱和度水平,融合传统循环神经网络的高内存容量与正交循环神经网络的稳定性。实验结果表明,ASRNN 比其他几种竞争对手在具有挑战性的序列学习基准上表现更好。