ACLJun, 2023

通过因果推断保留预训练语言模型中的常识知识

TL;DR通过在因果图上探索,本文发现灾难性遗忘的关键在于缺失来自预训练数据的因果影响,提出了一种统一的微调目标以恢复因果关系,将该方法实现在常识 QA 上的结果表明其有效性。