评价归因分数中的逻辑陷阱

ACLSep, 2021

Logic Traps in Evaluating Attribution Scores

Yiming Ju, Yuanzhe Zhang, Zhao Yang, Zhongtao Jiang, Kang Liu...

TL;DR该论文系统地回顾了现有的评估归属分数的方法，并总结了这些方法中的逻辑陷阱，旨在提高人们对不准确评估归属分数的注意力，并建议停止关注在不可靠的评估系统下提高性能方面的努力，而是致力于减少逻辑陷阱的影响。

Abstract

Modern deep learning models are notoriously opaque, which has motivated the development of methods for interpreting how deep models predict. This goal is usually approached with attribution method, which assesses

deep learning attribution method evaluation methods logic traps model predictions

发现论文，激发创造

通过系统评估更好地理解归因方法的差异

本研究提出了三种评估方案以更可靠地衡量不同的图像归因方法的可信度，并在一系列模型上研究了一些广泛使用的归因方法的优缺点，并提出一种后处理平滑步骤以显著提高某些归因方法的性能。

Mar, 2023

探究归因方法的改进

本文提出三种新的评估方案来衡量影响深度神经网络决策的图像区域，以及平衡各种评估方法之间的比较，并提出一个后处理平滑步骤来改善一些归因方法的性能。

May, 2022

使用 Taylor 相互作用理解和统一十四种归因方法

本文首次将诸多启发式设计的 14 种归因方法的核心机制，统一为一个数学系统，证明这 14 种方法的归因得分都可以重构为两种效应的加权求和，即每个输入变量的独立效应和输入变量之间的相互作用效应，并提出 3 个公平分配效应的原则来评价这 14 种归因方法的忠诚度。

Mar, 2023

诠释解释：按标准整理归因方法

该研究拓展了深度学习可解释性领域的基础，引入了必要性、充分性和比例概念等新的度量方法研究输入归因，以便比较不同方法和解释结果。研究评估了用于图像分类的不同 CNN 解释方法在必要性和充分性方面的表现。

Feb, 2020

EvalAttAI: 对鲁棒和非鲁棒模型中评估属性图的整体方法

探索透视医学影像分类应用的影响映射方法和度量评估，提出 EvalAttAI 度量已有度量的局限并进行改进，结果显示：使用 Vanilla Gradient 方法的贝叶斯深度神经网络通常更具可解释性。

Mar, 2023

神经网络特征评估中的不一致问题探究

近年来，神经网络展示出了从原始数据中识别复杂模式和关系的卓越能力。然而，理解这些黑盒模型的内部机制仍具挑战性，但对于高风险决策至关重要。我们的研究通过调查解释的基本和分布行为来解决这种困惑。此外，通过全面的模拟研究，我们展示了常见缩放和编码技术对解释质量的影响，评估它们在不同效应大小中的功效，并展示了基于排序的评估指标的不一致性的来源。

Apr, 2024

我不能预测的，我就不理解：一个以人为中心的可解释性方法评估框架

本研究通过心理物理实验评估了 AI 系统的说明方法的人类使用者的理解能力，并发现不同的场景对于提高人类理解 AI 系统的说明方法的效果存在较大的差异，因此需要开发提供定性信息的补充方法。

Dec, 2021

特征归因方法是否正确归因特征？

本研究探讨了利用特征归因方法进行机器学习的解释，提出通过修改数据集来产生真实归因的方法，并对三种常见的归因方法：显著性图、原理和注意力进行评估，发现这些方法在野外数据集中的正确性和可靠性值得怀疑，建议在部署前使用基准来测试新的归因方法。

Apr, 2021

评估特征归因方法的双重视角方法

特征归因方法通过识别相关特征来解释神经网络的预测结果，本研究在 “忠实度” 范式内提出了两个新视角：可靠性和完备性，分别评估特征是否真正预测，以及归因结果是否完整，并基于数学基础提供可计算的定量度量，将这些指标应用于主流归因方法，为分析和比较特征归因方法提供了新视角。

Aug, 2023

低资源环境下的预训练语言模型解释与归因分析

通过分析从基于提示的模型中提取的归因得分的合理性和忠实性，并将其与从微调模型和大型语言模型中提取的归因得分进行比较，我们发现使用基于提示的范例（无论是基于编码器的模型还是解码器的模型）比在低资源环境下微调模型产生更合理的解释，并且 Shapley Value Sampling 在产生更合理和忠实的解释方面始终优于注意力和积分梯度。

Mar, 2024