ACLJun, 2021

关于自然语言处理样本解释方法的效率、忠实度和语义评估

TL;DR本论文提出一种在自然语言处理中,以任意文本序列作为解释单元以提高解释的可解释性、效率和忠实度的方法,该方法实现了一种带模型的忠实度保证的 Hessian-free 算法,并且提出了一种基于语义的评估度量,该度量可以更好地与人类对解释的判断相匹配。多个实际数据集的实证结果表明,相对于 Influence Function 或 TracIn 等解释技术,所提出的方法具有优越的性能。