特征归因的稳定性评估框架：您的解释是否稳健？

Sep, 2022

特征归因的稳定性评估框架：您的解释是否稳健？

"Is your explanation stable?": A Robustness Evaluation Framework for Feature Attribution

Yuyou Gan, Yuhao Mao, Xuhong Zhang, Shouling Ji, Yuwen Pu...

TL;DR提出了一种模型无关的方法 MeTFA 用于量化不确定性并增加解释算法的稳定性，该方法可将信任度提高，并可在保持可信度的同时显著减少不稳定性，并展示了在语义分割模型中定位上下文偏差和抵御针对解释的对抗攻击的潜在能力。

Abstract

Understanding the decision process of neural networks is hard. One vital method for explanation is to attribute its decision to pivotal features. Although many algorithms are proposed, most of them solely improve the faithfulness to the model. However, the real environment contains man

neural networks feature attribution explanation algorithms uncertainty stability

发现论文，激发创造

您能相信您的解释吗？特征归因方法的健壮性测试

评估对非敌对扰动的稳健性并分析神经网络和表格数据集上应用的可解释 AI 方法的稳健性，展示如何利用流形假设和集成方法对稳健性进行深入分析。

Jun, 2024

稳健性分析解释的评估和方法

本文提出一种基于鲁棒性分析的特征解释新的评估标准，通过针对我们提出的评估标准进行优化，获得了松散且必要的解释和可以将当前预测移动到目标类的特征集。我们通过多领域实验和用户研究验证了我们评估标准和解释的有用性。

May, 2020

任意时刻的近似正式特征归因

人工智能和机器学习模型的广泛应用与一系列相关问题需要可解释的人工智能。形式特征归属是一种新的方法，定义了特征重要性作为包含给定特征的正式反演解释的比例。本文提出了一种高效的启发式算法以适应性地近似形式特征归属，在多个常用数据集上的实验结果表明了所提方法的有效性。

Dec, 2023

加法特征归因方法中的不确定性

我们研究了后事解释型人工智能方法中的不确定性，并提出了一种修改基于 LIME 的算法中抽样密度的相对复杂度测量方法，以帮助不同的解释算法实现更紧密的置信水平。

Nov, 2023

神经网络特征评估中的不一致问题探究

近年来，神经网络展示出了从原始数据中识别复杂模式和关系的卓越能力。然而，理解这些黑盒模型的内部机制仍具挑战性，但对于高风险决策至关重要。我们的研究通过调查解释的基本和分布行为来解决这种困惑。此外，通过全面的模拟研究，我们展示了常见缩放和编码技术对解释质量的影响，评估它们在不同效应大小中的功效，并展示了基于排序的评估指标的不一致性的来源。

Apr, 2024

基于特征重要性的视觉解释方法的稳定性，正确性和可信度

在可解释性人工智能领域，本文研究了基于图像分类器特征重要性的解释方法的稳定性、正确性和合理性之间的关系，并指出现有的评估指标并不总是一致的，进而提出了考虑被测模型的局部行为的新型评估指标。

Oct, 2023

论形式特征归属及其近似

借鉴形式推理解释，提出了正式特征归因（FFA）方法，通过近似 FFA 技术证明了其在特征重要性和顺序方面相对于现有特征归因算法的有效性。

Jul, 2023

评估特征归因方法的双重视角方法

特征归因方法通过识别相关特征来解释神经网络的预测结果，本研究在 “忠实度” 范式内提出了两个新视角：可靠性和完备性，分别评估特征是否真正预测，以及归因结果是否完整，并基于数学基础提供可计算的定量度量，将这些指标应用于主流归因方法，为分析和比较特征归因方法提供了新视角。

Aug, 2023

AttributionLab：在可控环境下的特征归因的可信度

设计 AttributionLab 环境用于测试特征归因方法的可靠性，并提供了一个控制实验室，用于研究特征归因方法、识别问题并提出潜在改进。

Oct, 2023

忠诚度度量中的不一致问题

解释性人工智能（XAI）领域旨在解释黑盒机器学习模型的工作方式，而选择合适的方法以及衡量本地解释的忠实度的当前指标缺乏一致性，使得使用者在选择最忠实的解释时感到困惑。

Nov, 2023