Feb, 2024

模型编辑的长篇评估

TL;DR模型编辑评估中长文本生成的有效性及影响的新型评估方法(LEME)揭示了模型编辑方法的新维度,其中一些方法在有限范围内具有良好的一致性,但更容易出现事实偏移问题。