Feb, 2024

斩首结束冲突:解析和缓解语言模型中的知识冲突机制

TL;DR通过信息流的角度解释知识冲突的机制,并在关键点进行精确干预,以解决语言模型中的知识冲突问题。通过剪枝冲突的注意力头部,我们提出了一种称为 PH3 的新方法,它可以高效地减轻知识冲突,并能改善语言模型在开放领域 QA 任务上的性能。