Oct, 2023

透过双向语言模型编辑解除逆转咒语

TL;DR本文研究双向语言模型编辑,旨在提供严格的模型编辑评估,以评估编辑后的语言模型是否能双向回忆编辑的知识。引入了一种新的可逆性评估度量,并构建了一个名为 Bidirectional Assessment for Knowledge Editing (BAKE) 的基准来评估编辑后模型在回忆编辑的知识反向方向上的可逆性。我们惊奇地发现,虽然当前的编辑方法和语言模型在编辑方向上能有效地回忆编辑的事实,但在反向方向上评估时存在严重不足。为了缓解这种逆转的问题,提出了一种名为 Bidirectionally Inversible Relationship moDeling (BIRD) 的方法。设计了一组编辑目标,将主体和客体之间的双向关系纳入更新后的模型权重中。实验证明,BIRD 通过问答和判断提高了四个不同规模的代表性语言模型的性能。