Jun, 2024

ROME 的倒台:对 LLMs 在模型编辑中崩溃的理解

TL;DR尽管模型编辑方法取得了显著进展,但在实际场景中应用仍然具有挑战性,因为它们经常导致大型语言模型发生崩溃。本文研究了这种崩溃的根本原因,并通过广泛的分析,确定了导致崩溃的两个主要因素。为了验证我们的分析,我们提出了一种简单而有效的方法:在编辑阶段统一使用带前缀的键,并在测试阶段添加前缀。实验结果表明,这种解决方案可以预防模型崩溃,同时保持编辑的有效性。