Oct, 2022

使用过度参数化递归神经网络学习低维状态空间

TL;DR本文研究了Gradient Descent在过参数化的线性循环神经网络上的外推性质,提供了理论证据表明算法会学习低维状态空间来建模长期记忆。实验验证了理论,表明线性和非线性循环神经网络可以通过学习低维状态空间来外推。