Jan, 2024
模型编辑可能损害大型语言模型的普适能力
Model Editing Can Hurt General Abilities of Large Language Models
Jia-Chen Gu, Hao-Xiang Xu, Jun-Yu Ma, Pan Lu, Zhen-Hua Ling...
TL;DR通过对两个大型语言模型在八个代表性任务类别上评估四种常用的编辑方法进行广泛实证研究后,我们发现模型的编辑能够提高模型的事实性,但会显著损害模型的通用能力,因此我们呼吁更多的研究努力来最小化在大语言模型预训练期间获得的通用能力的损失,并在模型编辑过程中最终保留它们。