ICMLOct, 2021

宽神经网络的遗忘相对较少

TL;DR这篇论文讨论了神经网络模型架构对于解决神经网络遗忘问题的影响,研究了模型宽度对于遗忘现象的意义,并从梯度正交性、稀疏和懒惰训练等角度探讨了神经网络学习动态以提供相应的解释。