Jan, 2024

模型编辑可能损害大型语言模型的普适能力

TL;DR通过对两个大型语言模型在八个代表性任务类别上评估四种常用的编辑方法进行广泛实证研究后,我们发现模型的编辑能够提高模型的事实性,但会显著损害模型的通用能力,因此我们呼吁更多的研究努力来最小化在大语言模型预训练期间获得的通用能力的损失,并在模型编辑过程中最终保留它们。