关于自然语言处理样本解释方法的效率、忠实度和语义评估

ACLJun, 2021

关于自然语言处理样本解释方法的效率、忠实度和语义评估

On Sample Based Explanation Methods for NLP:Efficiency, Faithfulness, and Semantic Evaluation

Wei Zhang, Ziming Huang, Yada Zhu, Guangnan Ye, Xiaodong Cui...

TL;DR本论文提出一种在自然语言处理中，以任意文本序列作为解释单元以提高解释的可解释性、效率和忠实度的方法，该方法实现了一种带模型的忠实度保证的 Hessian-free 算法，并且提出了一种基于语义的评估度量，该度量可以更好地与人类对解释的判断相匹配。多个实际数据集的实证结果表明，相对于 Influence Function 或 TracIn 等解释技术，所提出的方法具有优越的性能。

Abstract

In the recent advances of natural language processing, the scale of the state-of-the-art models and datasets is usually extensive, which challenges the application of sample-based explanation methods in many aspects, such as →

natural language processing explanation interpretability efficiency model faithfulness semantic-based evaluation metric

发现论文，激发创造

自然语言处理中的模型解释研究综述

本综述通过对忠实度的镜头，回顾了超过 110 种自然语言处理中的模型解释方法。我们考虑了忠实度的定义和评估，以及它对可解释性的重要性，并将现有方法分为五类。最后，我们总结了它们的共同优点和未解决的挑战，并反思了未来的研究方向。

Sep, 2022

模型无关 NLP 可解释性中解释的粒度

通过对复杂的基于 BERT 的分类器使用基于段落的方法，本文改进了当前基于单词采样的黑盒 NLP 可解释性方法的局限性，大大提高了基准分类任务的解释保真度。

Dec, 2020

基准测试忠实度：关于在视觉语言任务中实现准确的自然语言解释

本文探讨了目前逐渐普及应用的神经模型的透明度和可理解性的需求，提出了三种可信度测量方法，并在对不同模型架构的比较中使用 VQA-X 和 e-SNLI-VE 数据集进行了评估。

Apr, 2023

NLP 模型的解释方法稳健性

本文研究了关于文本模态下解释方法的鲁棒性及针对文本解释方法的对抗攻击，结果表明，输入语句及其语义的微小改变可以在很大程度上扰乱解释方法，达到 86% 的成功率。

Jun, 2022

关于解释在域外环境中的实证研究

该论文探索了自然语言处理中有关如何在不同领域中提取精准的解释的方法，其中侧重于后续解释和固有的忠诚度模型，并且发现后续解释的忠诚度在许多情况下比在领域内更高，而在跨域设置中，选择后预测模型的预测性能与完整训练模型相当。

Feb, 2022

基于概念的解释的可读性和忠实度评估

使用概念可信度和可读性作为评估概念解释的方法，通过量化忠诚度和自动测量可读性来解决黑箱模型的透明度问题。通过可靠性和有效性进行元评估，验证并选择概念评估措施。

Apr, 2024

针对 NLP 模型的最优健壮性解释保证

本文提出了基于绑架式解释的机器学习方法，为自然语言处理中的神经网络模型计算局部解释。根据用户定义的代价函数，例如解释长度，优化词汇子集以满足两个主要特征。同时在嵌入空间中确保预测不变性，该方法通过内隐命中集和最大通用子集两种解法得出结果，并可以配置不同的扰动集来检测预测结果的偏见，提高 NLP 解释框架的效果。最后，文章在 SST、Twitter 和 IMDB 数据集上对三种常用情感分析任务进行了评估，并展示了该框架的有效性。

May, 2021

情感分析解释的可信度和真实度评估

本文介绍了一种评估模型可解释性的方法，特别是在 NLP 领域中，提出了不同的评估指标和技巧来评估 SA 模型的可解释性。该方法被证明是可行的，同时发现了各种评估方法之间的差异，为设计更易于解释的 NLP 模型和评估其相对优势和鲁棒性提供了基础。

Oct, 2022

自然语言处理中的模型解释的敏感性和稳定性

该研究提出两个衡量 NLP 模型判断过程解释准确性的新标准，即灵敏度和稳定性，并引入了一种新的基于对抗性鲁棒性的解释方法，证明了其在相应标准下的优越性。还应用该方法和度量标准在依赖分析中。

Apr, 2021

构建学习的忠实理性化

提出了一种名为 FRESH 的简化模型解释方法，通过使用任意的特征重要性分数来导出二进制标签以训练提取器，再用提取器提供的片段训练独立分类器模块，从而构成可信解释，具有超越端到端方法的预测性能优势并更容易实现。

Apr, 2020