Mar, 2024

重建 ROME:解决串行模型编辑中的模型崩溃问题

TL;DR通过对模型编辑中的残疾编辑进行研究,作者发现残疾编辑会导致模型立即崩溃,限制了 Rank-One 模型编辑方法(ROME)的连续编辑的使用。在本文中,作者展示了模型编辑中的崩溃现象只会在使用 CounterFact 数据集进行编辑时出现,而在使用 zsRE 数据集时并不会出现。此外,作者发现残疾编辑是 ROME 原始实现的一个人为问题,通过提供了一个更稳定的 ROME 实现(称为 r-ROME),作者展示了使用 ROME 进行大规模连续编辑时不再观察到模型崩溃的现象。