May, 2023

(大型) 语言模型中实体偏见的因果视角

TL;DR通过提出特定的结构因果模型(SCM)及其上的因果干预技术,在白盒和黑盒模型中缓解了实体偏差,该干预通过干扰原始实体与邻近实体来减少与原始实体有关的特定偏见信息,同时仍保留来自相似实体的充分共同预测信息,在关系抽取任务上,我们的训练时间干预将 RoBERTa 的 F1 得分在 EntRED 上提高了 5.7 分,在 GPT-3.5 上,我们的上下文干预有效减少了参数化知识和上下文知识之间的知识冲突,并将 F1 得分在一个具有挑战性的测试集中提高了 9.14 分。