Nov, 2023

LLM 知识弃除:任务、方法与挑战

TL;DR近年来,大型语言模型(LLM)在自然语言处理领域引起了一种新的研究范式。然而,这些模型保留错误或甚至有害知识的潜力带来了恶意应用的风险。为了使这些模型能够广泛应用,解决这个问题并将其转化为纯粹的助手是至关重要的。为此,我们提供了一份关于 LLM 时代的知识遗忘的综述。我们从正式定义知识遗忘问题并与相关工作区分开始。随后,我们将现有的知识遗忘方法分为三类:基于参数优化、参数合并和上下文学习的方法,并介绍这些方法的细节。我们还介绍了现有方法中使用的评估数据集,并最后总结了这份综述中存在的挑战和未来的方向。