ACLMay, 2020

利用影响函数解释黑盒预测并揭示数据畸形

TL;DR该研究探讨使用影响函数解释 NLP 模型的决策,并与基于词汇显著性的方法进行比较。该方法被发现特别适用于自然语言推理这样复杂的任务,并且还开发了一种基于影响函数的新的定量衡量方法,可以揭示训练数据中的人为制品。