Nov, 2023

遗忘学习前:在大型语言模型中利用参数算术进行知识更新

TL;DR通过参数算术实现旧知识遗忘和新知识学习的新的精调范式 F-Learning 在两个公开数据集上的实验结果表明,该方法明显改善了完全精调和 LoRA 精调的知识更新性能,通过减去 LoRA 参数来忘记旧知识即可达到与完全精调相似的效果,有时甚至更好。