Dec, 2023

学习还是回忆?再探基于预训练语言模型的增量学习

TL;DR在自然语言处理领域中,基于预训练语言模型的增量学习的研究表明,现有的方法普遍低估了预训练语言模型天生的抗遗忘能力,研究者提出了一种名为 SEQ * 的简单方法,它在各项度量上与最先进的增量学习方法具有竞争力或更好的表现,并且需要较少的可训练参数和训练时间。