EMNLPNov, 2020

通过句子编辑探究语言模型可解释性

TL;DR本文旨在将一个句子编辑数据集复用成为解释性测试场,系统研究预训练语言模型的可解释性及在该场景下的解释效果,发现注意力权重相关性较高,并且比基于梯度的显著性提取方法更有效。