基于原型引导的可解释反事实解释

Jul, 2019

基于原型引导的可解释反事实解释

Interpretable Counterfactual Explanations Guided by Prototypes

Arnaud Van Looveren, Janis Klaise

TL;DR使用类原型的快速、模型无关方法可以找到分类器预测的可解释因果关系解释，并且该方法通过两个新的度量标准在实例级别上定量评估局部可解释性。该方法在图像数据集 MNIST 和表格数据集 Breast Cancer Wisconsin（Diagnostic）上得到了有效的验证，同时消除了由于数值梯度评估而产生的计算瓶颈。

Abstract

We propose a fast, model agnostic method for finding interpretable counterfactual explanations of classifier predictions by using class prototypes. We show that class prototypes, obtained using either an encoder or through class specific k-d trees, significantly speed up the the search

interpretable counterfactual explanations class prototypes local interpretability image dataset tabular dataset

发现论文，激发创造

利用生成潜空间中的对比可反事实来解释图像分类器

在不需要重新训练或调整的情况下，使用预训练的生成模型，介绍了生成因果关系和可解释的反事实解释方法，以提供对黑匣子算法的透明性，并获得对面部属性分类器的对比和因果支持和必要分数，从而展示不同属性如何影响分类器输出。

Jun, 2022

平滑解释黑匣子 —— 反事实方法

该研究提出了一种黑盒对抗解释器来解释医学应用中的图像分类模型，并通过对诊断放射学居民进行实验，发现反事实解释是唯一能显着提高用户对分类器决策理解的解释方法。

Jan, 2021

基于 Tree 集成的灵活可优化反事实解释解释（FOCUS）

为了解决机器学习模型的可解释性问题，本研究提出了一种基于梯度优化和概率模型逼近的反事实解释方法，可以适用于不可微模型如树模型，并且该方法得出的反事实案例要优于其他针对树模型的反事实方法。

Nov, 2019

可解释图像识别的原型解释

通过量化影响色调、形状、纹理、对比度和饱和度的视觉特征，提高基于原型的图像识别的可解释性。

Nov, 2020

基于实例的时间序列分类对抗解释

本文提出了一种模型无关的案例技术 ——Native Guide，用于生成时间序列分类器的反事实解释，该技术通过突出和修改分类的基础部分来调整已有的反事实情况，并通过两个比较实验的定量和定性结果验证了其优越性。

Sep, 2020

利用反事实推理的因果生成解释器：以 Morpho-MNIST 数据集为案例研究

提出使用因果生成学习作为解释图像分类器的可解释工具，利用生成对事实推理方法研究视觉特征和因果因素对分类器决策的影响，提供了针对可解释因果数据集的对抗解释方法，通过与 OmnixAI 开源工具进行对比，发现我们的方法提供的对事实解释更可解释，适用于生成高度可解释的对事实解释。

Jan, 2024

自知的鉴别反事实解释

该研究提出了一种新的判别性反事实视觉解释方法，通过结合三个归属图来计算反事实图，从而更快地获得表现良好的结果，并通过一套量化指标来评价结果。

Apr, 2020

OCTET: 基于对象的反事实解释

本研究提出了一种以物体为中心的框架来生成反事实解释，该方法通过将查询图像编码到潜在空间中，以便在物体级别上进行操作，并且可以适用于驾驶场景的反事实解释基准测试，并且设计并运行了用户研究以衡量反事实解释在理解决策模型方面的有用性。

Nov, 2022

针对反事实解释的条件生成模型

该论文提出了一种生成利用条件生成模型来生成稀疏的、在分布中反事实模型解释的通用框架，可适用于不同模态的数据，并说明了该方法在图像、时间序列和混合类型表格数据上的有效性。

Jan, 2021

通过不同的反事实解释解释机器学习分类器

本文提出了一种基于决定点过程的生成和评估多样性反事实解释的框架，旨在优化反事实行为的可行性和多样性，并提供了可比较的度量标准来评估反事实方法。通过实验，验证了该框架能生成多样性的反事实，并且能有效地近似本地决策边界。

May, 2019