Aug, 2023
Eva-KELLM: 一个用于评估 LLMs 的知识编辑的新基准
Eva-KELLM: A New Benchmark for Evaluating Knowledge Editing of LLMs
Suhang Wu, Minlong Peng, Yue Chen, Jinsong Su, Mingming Sun
TL;DR评估大型语言模型的知识编辑能力和知识迁移效果的新基准 Eva-KELLM,采用原始文档进行知识编辑,从多个角度评估其效果,研究发现当前使用原始文档进行知识编辑的方法在处理修改后的知识以及跨语言知识迁移时效果不佳。