May, 2023

通过持续学习调查预训练表示中的遗忘

TL;DR本文研究了表示遗忘对预训练语言模型的泛化能力的影响,提出了三个度量方式来衡量泛化能力的演变,并发现了泛化能力存在遗忘。在实验中,我们发现训练泛化语言任务可以减轻泛化知识的遗忘,同时使用混合的连续学习方法可以减轻泛化破坏,与那些只考虑排练或正则化的方法相比,可以保持更多的泛化知识。