针对反事实解释的条件生成模型

Jan, 2021

Conditional Generative Models for Counterfactual Explanations

Arnaud Van Looveren, Janis Klaise, Giovanni Vacanti, Oliver Cobb

TL;DR该论文提出了一种生成利用条件生成模型来生成稀疏的、在分布中反事实模型解释的通用框架，可适用于不同模态的数据，并说明了该方法在图像、时间序列和混合类型表格数据上的有效性。

Abstract

counterfactual instances offer human-interpretable insight into the local behaviour of machine learning models. We propose a general framework to generate sparse, in-distribution counterfactual model explanations

counterfactual instances machine learning models generative model predictive model sparse explanations

发现论文，激发创造

生成多元时间序列稀疏反事实解释

本文介绍了一种基于生成对抗网络（GAN）架构的 SPARCE 方法，用于多变量时间序列的稀疏反事实解释，并在真实世界的人体动作数据集以及一个时间序列的解释性基准上得到了验证。

Jun, 2022

计算反事实解释的方法 —— 一项调查研究

机器学习模型日益广泛应用，因此解释其预测和行为变得越来越重要。本文综述了针对多种不同机器学习模型高效计算对抗性解释的模型特定方法，并提出了文献中尚未考虑的模型方法。

Nov, 2019

利用生成潜空间中的对比可反事实来解释图像分类器

在不需要重新训练或调整的情况下，使用预训练的生成模型，介绍了生成因果关系和可解释的反事实解释方法，以提供对黑匣子算法的透明性，并获得对面部属性分类器的对比和因果支持和必要分数，从而展示不同属性如何影响分类器输出。

Jun, 2022

一种可行的反事实探索框架：融合因果关系、稀疏性和密度

通过对属性的逻辑因果关系保护，使用黑箱模型作为分类器并利用变分自动编码器生成可行的对抗性示例，本研究在不同基准数据集上实验，成功生成可行且稀疏的对抗性示例，满足所有预定义的因果约束。

Apr, 2024

机器学习分类器反事实解释中的因果约束保持

通过使用结构性因果模型，生成可行的对抗样本对于解释人工智能模型在医疗和金融等关键领域的决策是至关重要的。本论文提出了一种生成适用于实际应用中的可行对抗样本的方法，并且通过实验证明了其效果。

Dec, 2019

通过不同的反事实解释解释机器学习分类器

本文提出了一种基于决定点过程的生成和评估多样性反事实解释的框架，旨在优化反事实行为的可行性和多样性，并提供了可比较的度量标准来评估反事实方法。通过实验，验证了该框架能生成多样性的反事实，并且能有效地近似本地决策边界。

May, 2019

针对表格数据的学习模型无关反事实解释

本文提出了一种新的方法 ——C-CHVAE，该方法可以生成可实现的反事实解释，以更好地满足反事实解释的质量要求。

Oct, 2019

对策说明的随机优化

通过提出一种基于随机学习的框架和特征选择模块来平衡反事实解释的权衡，本研究在生成可行的反事实解释方面展现了其有效性，并表明其比基线更加多样化和高效。

Sep, 2022

半监督反事实解释

通过引入自编码器重建损失，将分类器输出结果与自编码器的潜空间相连接，从而提高干预解释搜索过程的速度和解释干预结果的可解释性，尤其在自编码器以半监督方式训练的情况下进一步提高了其解释性。在多个数据集上的实验验证了该方法的有效性。

Mar, 2023

OCTET: 基于对象的反事实解释

本研究提出了一种以物体为中心的框架来生成反事实解释，该方法通过将查询图像编码到潜在空间中，以便在物体级别上进行操作，并且可以适用于驾驶场景的反事实解释基准测试，并且设计并运行了用户研究以衡量反事实解释在理解决策模型方面的有用性。

Nov, 2022