CHILLI: 一种面向数据背景的解释可能性干扰方法

Jul, 2024

CHILLI: 一种面向数据背景的解释可能性干扰方法

CHILLI: A data context-aware perturbation method for XAI

Saif Anwar, Nathan Griffiths, Abhir Bhalerao, Thomas Popham

TL;DR机器学习模型的可信性对于高风险或伦理敏感的应用非常重要，因为许多模型被视为黑盒子，用户无法理解最终决策的推理或标准。为了解决这个问题，已有的可解释人工智能方法使用扰动数据来近似模型行为。然而，这些方法被批评忽略了特征之间的依赖性，解释基于的数据可能是不现实的。我们提出了一个新颖的框架 CHILLI，通过生成与待解释基本模型的训练数据相符的有上下文意识的扰动，将上下文信息融入可解释人工智能中。实验证明，这种方法提高了解释的完备性和准确性。

Abstract

The trustworthiness of machine learning (ML) models can be difficult to assess, but is critical in high-risk or ethically sensitive applications. Many models are treated as a `black-box' where the reasoning or cr

发现论文，激发创造

度量效用、赢得信任：XAI研究员的实用建议

机器学习模型解释学（即可解释性AI）的研究与深度人工神经网络同步呈指数增长，但传统的信任和解释却太狭隘，导致研究社区被误导。该研究提出了一种实用的解决方案，建议研究人员关注机器学习解释的实用性而非信任，提出五种广泛的用例，并为每种情况描述可依靠客观经验测量和可证伪假设的伪实验。该实验严谨的处理方法将对XAI领域的科学知识的进一步贡献是必要的。

Sep, 2020

我们需要另一种可解释的AI方法吗？将事后可解释性评估方法统一为一种交互式和多维基准

提出了一种名为Compare-xAI的基准测试框架，该框架统一了xAI算法的所有排他性功能测试方法，帮助研究人员、从业人员和普通人解释模型结果，同时提供了可互动的用户界面。

Jun, 2022

可解释人工智能中的元评估问题: 使用MetaQuantus识别可靠评估器

本文提出了一个元评估框架MetaQuantus，以较可靠的方式鉴别不同解释质量度量方法在特定的解释情境下的性能，包括其对噪声的鲁棒性和对随机性的反应性，并通过一系列实验展示了其有效性。该工具可用于验证和基准测试新建构的度量衡，从而为建立可靠的方法提供清晰的、理论上的指导，以促进Explainable AI领域中的标准化和可重复性。

Feb, 2023

使用形式化方法证明XAI神话--初步结果

这篇研究论文探讨了可解释人工智能的重要性以及存在的困境和误解，通过形式化方法来反驳这些误解并提出实际有效的替代方法。

May, 2023

自然样本为基础的可解释性：一项调查

该论文提供了自然基于示例的可解释人工智能领域的现状概述，描述了每种方法的优点和缺点，并比较了它们的语义定义、认知影响和附加价值。希望这将鼓励和促进未来在此领域的工作。

Sep, 2023

机器学习模型的可解释性：从数据适应性到用户感知

该研究旨在生成能满足数据和用户要求的本地解释，以便解释已部署的机器学习模型。通过增强一种广泛使用的基于规则的解释方法、引入一种评估线性解释逼近模型适用性的新方法，并对两种对照解释方法家族进行比较实验，从而为任何模型生成可靠且用户可理解的解释方法提供了一种途径。此外，该研究通过用户实验评估了三种解释方法和两种不同表示形式的影响，测量用户在理解和信任方面对模型交互的感知。通过提升解释生成的质量，该研究对增强已部署的人工智能系统的透明度、可信度和可用性具有潜在的影响。

Feb, 2024

不确定性解释性：神经网络的可信决策

机器学习模型中的不确定性是一个关键特征，尤其在神经网络中更为重要，因其倾向于过于自信。本研究提出了一个通用的不确定性框架，将不确定性估计定位为可解释的人工智能技术，并引入分类与拒绝机制以减少错误分类，同时应用于教育数据挖掘中的神经网络案例研究，提高模型在操作研究中决策任务中的可信度与行动性。

Mar, 2024

EXACT：用于机器学习模型解释方法经验基准测试的平台

该研究论文介绍了一个旨在改善复杂机器学习模型可解释性的解释性人工智能（XAI）领域的发展趋势，并提出了一个初始的基准测试平台 EXACT，该平台结合了各种基准数据集和新颖的性能评估指标，为评估 XAI 方法提供了一个标准化的基础。

May, 2024

为何解释失败？XAI中失败的分类和讨论

机器学习解释的复杂性和局限性对解释的解读产生了多重影响，本研究对现行可解释人工智能方法的局限性进行了系统调查，并提出了一种分类框架来揭示解释失败的复杂性。

May, 2024

机器学习模型中的统一解释：一种扰动方法

面向可解释人工智能（XAI）的高速范式转变已在近年来出现。高度复杂的机器学习（ML）模型在许多智能任务中蓬勃发展，而问题开始从传统的有效性度量转向更深层次的问题：该模型告诉我关于我的数据什么，它是如何得出这些结论的？XAI和建模技术之间的不一致可能对这些解释性方法的效力产生质疑。为了解决这些问题，我们提出了一种针对流行的XAI的模型不可知方法SHapley Additive exPlanations（Shap）进行系统的扰动分析。我们设计了一些算法，在动态推理的设置下生成相对特征重要性，这些设置针对一套流行的机器学习和深度学习方法，以及允许我们量化静态情况下生成解释的质量的度量指标。我们提出了特征重要性方法论的分类体系，度量了一致性，并观察了几个数据集中解释模型之间的可量化相似性。

May, 2024