具有归一化流的概率可信因果解释

May, 2024

具有归一化流的概率可信因果解释

Probabilistically Plausible Counterfactual Explanations with Normalizing Flows

Patryk Wielopolski, Oleksii Furman, Jerzy Stefanowski, Maciej Zięba

TL;DR我们提出了 PPCEF，一种用于生成概率上可信的反事实解释（CFs）的新方法。PPCEF 通过将概率形式与在一个统一框架内优化可信度相结合，超越了现有方法。与参考方法相比，我们的方法通过直接优化显式密度函数而不假定特定的参数化分布家族来强制执行可信度。这确保了 CFs 不仅是有效的（即实现了类别变化），而且与底层数据的概率密度相一致。为此，我们的方法利用规范化流作为强大的密度估计器来捕捉复杂的高维数据分布。此外，我们引入了一种新颖的损失函数，平衡了实现类别变化和保持与原始实例的相似性之间的权衡，并结合了概率可信度项。PPCEF 的无约束形式允许有效的基于梯度的批处理优化，与之前的方法相比，计算速度提高了几个数量级。此外，PPCEF 的无约束形式允许将来的约束无缝集成，以符合特定的反事实属性。最后，广泛的评估证明了 PPCEF 在生成高质量、概率上可信的高维表格设置中的反事实解释方面的优势。这使得 PPCEF 不仅成为解释复杂机器学习模型的强大工具，而且提高了 AI 系统的公平性、问责制和信任度。

Abstract

We present ppcef, a novel method for generating probabilistically plausible counterfactual explanations (CFs). ppcef advances beyond existing methods by combining a probabilistic formulation that leverages the da

ppcef probabilistically plausible counterfactual explanations plausibility normalizing flows high-dimensional tabular settings

发现论文，激发创造

CeFlow：使用标准化流的稳健高效表格数据反事实解释框架

本文介绍了一种称为 CeFlow 的鲁棒且高效的计数事实解释框架，其利用正态化流来解决采样不稳定和计算速度慢的问题，并具有与最先进的方法相当的性能。

Mar, 2023

统一视角：全球、群体和局部级别上的合理反事实解释

通过梯度优化，引入了一种新的整合方法，为可区分分类模型生成本地、小组和全局反事实解释，以解决全局反事实解释所面临的挑战，并增强了可行性和可信度，从而提高了 AI 模型的可解释性和负责任性。

May, 2024

灵活稳健的反事实解释与最小满足扰动

通过 Counterfactual Explanations with Minimal Satisfiable Perturbations (CEMSP) 提供更健壮的解释，同时保留灵活性，以应对多个 Counterfactual explanations 可能导致的不稳定性问题。

Sep, 2023

保持亲密关系，让反事实更近：在抽象设置中从最近的反事实解释中提高学习效果

本研究旨在评估计算合理性和心理合理性之间的差异，结果表明，心理学合理性与计算合理性之间存在巨大差异，特别是在处理详细的模型解释时，需要考虑人类行为，偏好和心理模型，以在 XAI 的设计阶段获得更好的用户体验。

May, 2022

一种可行的反事实探索框架：融合因果关系、稀疏性和密度

通过对属性的逻辑因果关系保护，使用黑箱模型作为分类器并利用变分自动编码器生成可行的对抗性示例，本研究在不同基准数据集上实验，成功生成可行且稀疏的对抗性示例，满足所有预定义的因果约束。

Apr, 2024

基于模型的针对表数据的考虑特征空间属性的反事实解释

该研究提出了一种使用标准化流的高效反事实解释方法，该方法捕捉复杂数据分布，学习具有保持接近性的有意义的潜在空间，并改进预测，特别在处理分类变量时表现出色。

Apr, 2024

通过鲁棒优化为神经网络提供可证明稳健和可信的反事实解释

使用鲁棒优化技术，我们提出了 Provably RObust and PLAusible Counterfactual Explanations (PROPLACE) 方法来解决现有工作中的局限性，并通过比较实验证明其在三个评估方面的性能达到了最先进水平。

Sep, 2023

基于用户反馈的反事实解释介绍 (UFCE)

本研究引入了一种新的方法论，名为用户反馈式反事实解释（UFCE），以解决当前反事实解释算法的局限性，并旨在提高对提供的解释的置信度。实验证明，UFCE 在接近度、稀疏度和可行性方面胜过两种著名的 CE 方法，并指出用户约束对生成可行的反事实解释具有影响。

Feb, 2024

基于 PSO 的高维数据生成可操作的反事实

基于粒子群优化的高效可行反事实生成方法被提出，该算法在实际数据集上通过一组行动性指标评估，结果优于现有技术。

Sep, 2023

生成深度学习的可信反事实和半事实解释

研究提出一种新方法 PlausIble Exceptionality-based Contrastive Explanations (PIECE)，用于生成黑匣子 CNN 分类器的可信反事实和半事实，称其比文献中的其他方法生成最可信的反事实和半事实。

Sep, 2020