Jan, 2024

传播与陷阱:通过反事实任务进行基于推理的知识编辑评估

TL;DR当前的知识编辑方法在有效传播互联事实的更新方面存在困难。本研究深入探讨了在准确推理中妨碍更新知识适当传播的障碍。为了支持我们的分析,我们引入了一个新颖的基于推理的基准测试 - ReCoE(基于推理的反事实编辑数据集),其中涵盖了真实世界中的六个常见推理方案。我们对包括输入增强、微调和定位 - 编辑在内的现有知识编辑技术进行了彻底分析。我们发现,所有模型编辑方法在这个数据集上显示出明显的低性能,特别是在某些推理方案上。通过对编辑模型思维链的分析,我们从推理的角度揭示了现有知识编辑方法不足的关键原因,涉及到对事实的编辑,事实回忆能力和生成连贯性方面。我们将公开提供我们的基准测试。