Nov, 2023

曲率解释了塑性丧失

TL;DR神经网络的可塑性丧失是一种现象,其能力从新的经验中学习受到影响。本文提供了关于可塑性丧失的一致解释,认为在训练过程中神经网络方向的曲率减少导致了可塑性的丧失。通过对多个连续监督学习问题进行系统的实证研究,我们发现曲率减少与可塑性丧失同时或之前发生,同时证明了以前的解释无法解释所有情况下的可塑性丧失。最后,我们展示了可以缓解可塑性丧失的正则化方法也能保持曲率,提出了一种简单的分布正则化方法,在考虑的问题设置中被证明是有效的。