分析训练样本对解释的影响

IJCAIJun, 2024

Analyzing the Influence of Training Samples on Explanations

André Artelt, Barbara Hammer

TL;DR通过解释 AI 系统的决策，例如提供达到子程序目标的反事实解释，来分析 AI 系统的推理是一种流行的可解释 AI（XAI）方法。本文提出了一个新问题，即识别对给定解释（或相关量）有很高影响力的训练数据样本，并研究了受保护群体之间子程序成本差异的特定情况。我们提出了一种算法来识别这样的有影响力的训练样本。

Abstract

explainable ai (xai) constitutes a popular method to analyze the reasoning of AI systems by explaining their decision-making, e.g. providi

explainable ai xai reasoning training data influential training samples

发现论文，激发创造

探索从业者对训练数据归因解释的见解

解释性人工智能旨在向人类提供对不透明模型推理的深入理解，是一个跨学科的领域。本文通过对 10 名实践者的访谈，确认了在实践中训练数据质量通常是高性能模型的最重要因素，并且模型开发者主要依靠自己的经验来策划数据。最终用户期望解释能够增强他们与模型的交互，并且并不一定将训练数据作为解释的首要选择。在参与者中，发现训练数据归因解释并不为人熟知，因此也未被使用。我们敦促研究社区从人机协作的角度关注训练数据归因技术的实用性，并扩大对其评估以反映实践中的常见用例。

Oct, 2023

走向可解释人工智能（XAI）：数据挖掘视角

通过数据挖掘方法和应用的角度，对深度神经网络进行可解释人工智能（XAI）的综合、数据中心的研究，并将现有工作分为三类：对深层模型的解释、对训练数据的影响以及领域知识的洞察。

Jan, 2024

一种生成带有 XAI 地面真实性数据集的方法，以评估图像模型的新方法

本研究提出了一种生成具有真实标准数据集的新方法来衡量可解释人工智能的解释质量，并通过实验证明了该方法的正确性。

Feb, 2023

可解释人工智能在数据驱动系统中的隐私影响

机器学习模型的不透明性威胁到其可解释性，可解释人工智能（XAI）技术通过提供解释 ML 模型内部决策过程的框架和方法来解决这一挑战，同时维护隐私的难题需要在理解 ML 决策和保护隐私之间找到平衡点。

Jun, 2024

利用可解释的人工智能来提高神经网络的性能

本研究提出了一种重新训练流程，使用 SHapley Additive explanations 值，从 XAI 入手并利用最先进的技术来增加模型的透明度和可信度，在人数统计场景和图像分类数据集上进行了实验验证，结果表明使用 SHAP-based 重新训练方法比使用相等加权训练方法更有效，分别提高了 4% 和 3% 的准确率。

Oct, 2022

用于评估 XAI 方法的数据代表真实解释

本文介绍了使用规范方程代表解释的方法，以解决可解释的人工智能和可解释的机器学习方法面临的挑战，并提出使用合成数据来评估模型准确性的方法。

Nov, 2020

视觉解释的可解释人工智能基准

深度学习算法的崛起在计算机视觉任务中取得了重大进展，但它们的 “黑匣子” 性质引发了对可解释性的关注。可解释人工智能（XAI）作为一个重要的研究领域出现，旨在打开这个 “黑匣子”，并揭示人工智能模型的决策过程。视觉解释作为可解释人工智能的一个子集，通过突出显示输入图像中的重要区域，为处理视觉数据的人工智能模型的决策过程提供直观的见解。我们提出了一个 XAI 基准，其中包括来自不同主题的数据集集合，为图像提供了类别标签和相应的解释注释。我们引入了一个全面的视觉解释流程，在这个流程中整合了数据加载、预处理、实验设置和模型评估过程。此结构使研究人员能够公平比较各种视觉解释技术。此外，我们对视觉解释的超过 10 种评估方法进行综合评述，以帮助研究人员有效利用我们的数据集合。为了进一步评估现有的视觉解释方法的性能，我们使用各种以模型为中心和以真实标注为中心的评估指标在选定的数据集上进行实验。我们希望这个基准可以推动视觉解释模型的进步。这个 XAI 数据集合和用于评估的易于使用的代码公开可访问。

Oct, 2023

关于可解释人工智能研究中不当样本大小和普适性的原则：更加包容的用户研究

为了更好地实现伦理框架中所需的可解释性，我们需要更具有代表性的用户样本，同时需要更多考虑样本大小的合理性和研究结论的适用性，以促进可解释 AI 研究的进展。

May, 2023

机器学习模型中的统一解释：一种扰动方法

面向可解释人工智能（XAI）的高速范式转变已在近年来出现。高度复杂的机器学习（ML）模型在许多智能任务中蓬勃发展，而问题开始从传统的有效性度量转向更深层次的问题：该模型告诉我关于我的数据什么，它是如何得出这些结论的？XAI 和建模技术之间的不一致可能对这些解释性方法的效力产生质疑。为了解决这些问题，我们提出了一种针对流行的 XAI 的模型不可知方法 SHapley Additive exPlanations（Shap）进行系统的扰动分析。我们设计了一些算法，在动态推理的设置下生成相对特征重要性，这些设置针对一套流行的机器学习和深度学习方法，以及允许我们量化静态情况下生成解释的质量的度量指标。我们提出了特征重要性方法论的分类体系，度量了一致性，并观察了几个数据集中解释模型之间的可量化相似性。

May, 2024

自然样本为基础的可解释性：一项调查

该论文提供了自然基于示例的可解释人工智能领域的现状概述，描述了每种方法的优点和缺点，并比较了它们的语义定义、认知影响和附加价值。希望这将鼓励和促进未来在此领域的工作。

Sep, 2023