在大规模状态空间中学习可行的反事实解释

Apr, 2024

在大规模状态空间中学习可行的反事实解释

Learning Actionable Counterfactual Explanations in Large State Spaces

Keziah Naggita, Matthew R. Walter, Avrim Blum

TL;DR我们提供了一个实验证明的深度网络学习过程，可以在此任务上取得强大的性能表现。我们考虑了几种问题形式，包括在未明确提供 “能力” 和行动影响的情况下的公式，因此存在信息挑战和计算挑战。我们的问题也可以看作是在一系列大型但确定性的马尔可夫决策过程（MDPs）中学习最优策略之一。

Abstract

counterfactual explanations (CFEs) are sets of actions that an agent with a negative classification could take to achieve a (desired) positive classification, for consequential decisions such as loan applications, hiring, admissions, etc. In this work, we consider settings where optima

counterfactual explanations weighted set cover problems deep-network learning optimization problem markov decision processes

发现论文，激发创造

基于 PSO 的高维数据生成可操作的反事实

基于粒子群优化的高效可行反事实生成方法被提出，该算法在实际数据集上通过一组行动性指标评估，结果优于现有技术。

Sep, 2023

灵活稳健的反事实解释与最小满足扰动

通过 Counterfactual Explanations with Minimal Satisfiable Perturbations (CEMSP) 提供更健壮的解释，同时保留灵活性，以应对多个 Counterfactual explanations 可能导致的不稳定性问题。

Sep, 2023

一种可行的反事实探索框架：融合因果关系、稀疏性和密度

通过对属性的逻辑因果关系保护，使用黑箱模型作为分类器并利用变分自动编码器生成可行的对抗性示例，本研究在不同基准数据集上实验，成功生成可行且稀疏的对抗性示例，满足所有预定义的因果约束。

Apr, 2024

可行和可操作的反事实解释

针对反事实解释存在的缺陷，提出了一种基于密度加权度量定义的 FEASIBLE 体系，旨在聚焦于提供可执行和可行的路径，生成与底层数据分布一致的二元组和支持的更改路径，从而消除了 Counterfactual 方法中 idiosyncratic 这一问题。

Sep, 2019

超越一刀切：将反事实解释适应用户目标

解释性人工智能 (XAI) 是一项关键研究领域，旨在增强人工智能系统的透明度和解释性。反事实解释 (CFEs) 通过探索某些因素不同的替代情景，为机器学习算法的决策过程提供有价值的洞察。本文主张细致理解 CFEs，了解用户目标和目标应用的多样化需求，以设计更有效且量身定制的解释，以满足用户的特定需求，从而提高与人工智能系统的协作。

Apr, 2024

基于用户反馈的反事实解释介绍 (UFCE)

本研究引入了一种新的方法论，名为用户反馈式反事实解释（UFCE），以解决当前反事实解释算法的局限性，并旨在提高对提供的解释的置信度。实验证明，UFCE 在接近度、稀疏度和可行性方面胜过两种著名的 CE 方法，并指出用户约束对生成可行的反事实解释具有影响。

Feb, 2024

决策、反事实解释与战略行为

本文旨在在战略环境下寻找最优的政策和对策解释，包括 NP 难的问题，非降性和子模性，用标准贪心算法获得近似保证。最后，我们表明通过将拟阵约束加入问题的制定中，我们可以提高对策解释的最优集合的多样性，并激励整个人口谱上的个体自我改进。

Feb, 2020

无训练数据的多变量时间序列的反事实解释

本研究提出了 CFWoT，一种基于强化学习的反事实解释方法，用于生成反事实解释。CFWoT 适用于没有训练数据集的静态和多变量时间序列数据集，并可以处理连续和离散特征。CFWoT 生成的反事实解释所需进行的改变更少且更小，使其更具可操作性。

May, 2024

通过数学优化在基于得分的分类中生成集体反事实解释

利用数学优化模型，通过集体反事实解释为给定组内各实例提供一个反事实解释，以使扰动实例的总成本在一定约束下最小化，从而检测对整个数据集都至关重要的特征，验证了该方法的实用性。

Oct, 2023

线性优化的反事实解释

探究了对复杂 AI 系统内部工作方式的理解中产生的反事实解释（CE）概念，并将 CE 的思想转化为线性优化，提出、激发、并分析了三种不同类型的 CE：强 CE、弱 CE 和相对 CE。通过检测和利用后一种情况下产生的优化问题的隐藏凸结构，证明计算相对 CE 的效率高。通过对 NETLIB 库进行广泛的数值实验研究，证实了获得相对 CE 可以在与解决原始线性优化问题相同数量级的时间内完成。

May, 2024