上下文感知型特征归属分析

Oct, 2023

Context-aware feature attribution through argumentation

Jinfeng Zhong, Elsa Negre

TL;DR通过论证的方式，提出了一种上下文感知特征归因的框架 CA-FATA，该框架将每个特征作为一个支持、攻击或中立预测的论证，通过论证过程进行特征归因计算，具有明确的语义和可解释性，并且能够整合用户上下文等额外信息以实现更准确的预测。

Abstract

feature attribution is a fundamental task in both machine learning and data analysis, which involves determining the contribution of individual features or variables to a model's output. This process helps identi

feature attribution machine learning context-aware argumentation ca-fata

发现论文，激发创造

定量双极论证框架中的论证归因解释

解释性 AI 的一个关键问题是如何解释 Argumentation Frameworks (AFs) 的推理结果，而定量推理结果在 gradual semantics 下的解释尚未得到广泛关注。本文提出了一个新的 Argument Attribution Explanations (AAEs) 理论，通过在 Quantitative Bipolar Argumentation Frameworks (QBAFs) 中引入机器学习中的特征归因理念，研究 AAEs 的理论性质，并通过两个案例研究验证了 AAEs 在假新闻检测和电影推荐系统中的应用性。

Jul, 2023

当因子化遇到论证：朝着论证性解释的方向

该研究提出一种将基于因子分解的模型与论证框架相结合的新模型，通过在模型的每个阶段提供明确的含义，使其能够产生易于理解的推荐解释，并能够结合用户上下文等附加信息实现更准确的预测。

May, 2024

论形式特征归属及其近似

借鉴形式推理解释，提出了正式特征归因（FFA）方法，通过近似 FFA 技术证明了其在特征重要性和顺序方面相对于现有特征归因算法的有效性。

Jul, 2023

走向严格解释：特征归因的形式化

本文提出了一种基于放松的功能依赖概念的特征选择 / 归因的正式化方法，通过在合成数据集上计算基本真实的归因，评估了许多最先进的归因方法，并展示了即使在优化时，某些归因方法也无法验证所提出的属性并提供错误的解决方案。

Apr, 2021

使用 Feature Attribution 算法探究可控因素对医学案例的影响

提出一个称为 Controllable fActor Feature Attribution (CAFA) 的方法，将特征划分为可控和不可控部分来计算相关特征的相对重要性，使用 CAFA 算法在现有数据集和 COVID-19 的非药物控制措施数据集中测试，得到的实验结果表明，使用 CAFA 算法的解释可以排除不可控特征的影响，同时保留完整的数据集进行预测。

Mar, 2022

任意时刻的近似正式特征归因

人工智能和机器学习模型的广泛应用与一系列相关问题需要可解释的人工智能。形式特征归属是一种新的方法，定义了特征重要性作为包含给定特征的正式反演解释的比例。本文提出了一种高效的启发式算法以适应性地近似形式特征归属，在多个常用数据集上的实验结果表明了所提方法的有效性。

Dec, 2023

神经网络特征评估中的不一致问题探究

近年来，神经网络展示出了从原始数据中识别复杂模式和关系的卓越能力。然而，理解这些黑盒模型的内部机制仍具挑战性，但对于高风险决策至关重要。我们的研究通过调查解释的基本和分布行为来解决这种困惑。此外，通过全面的模拟研究，我们展示了常见缩放和编码技术对解释质量的影响，评估它们在不同效应大小中的功效，并展示了基于排序的评估指标的不一致性的来源。

Apr, 2024

统一特征归属和反事实说明：不同的手段达成了相同的目的

通过真实因果关系框架提供一种将特征归因和反事实解释统一的解释方法，通过在 Adult-Income，LendingClub 和 German-Credit 三个基准数据集上的实验，发现 Feature attribution 方法和 counterfactual explanation 方法并不总是一致的，也表明了他们之间的互补性。

Nov, 2020

自然语言模型理解中的本地聚合特征归因

本文提出了用于自然语言处理模型的新型基于梯度的特征暗示方法（Locally Aggregated Feature Attribution，LAFA），通过汇集从语言模型嵌入推导出的类似参考文本来平滑梯度，以实现对模型的解释性。该方法在公共数据集上进行了实验，包括实体识别和情感分析以及在构建的 Amazon 目录数据集上对重要特征的检测。通过实验，证明了该方法的优越性能。

Apr, 2022

特征归属方法的效果及其与自动评估得分的相关性

本研究第一次进行用户研究来证明特征归因图对于 ImageNet 分类和 Stanford Dogs 细粒度分类的辅助作用，在更难的分类任务上，特征归因图并没有帮助，相反会降低人工智能和人类团队的性能，并且自动特征归因图评估指标与实际人工智能 - 人类团队的表现相关性较差，本研究提倡社区在人机互动的应用中对他们的方法进行严格的测试，并重新思考现有的评估指标。

May, 2021