结构化数据的模型无关对比解释

May, 2019

Model Agnostic Contrastive Explanations for Structured Data

Amit Dhurandhar, Tejaswini Pedapati, Avinash Balakrishnan, Pin-Yu Chen, Karthikeyan Shanmugam...

TL;DR提出了一种模型无关对比解释方法（MACEM），旨在对任何分类模型生成对比解释，该方法处理实际和分类特征，提出了计算相应正例和反例的新方法，并通过 5 个公共数据集的定量和定性验证来证明该方法的有效性。

Abstract

Recently, a method [7] was proposed to generate contrastive explanations for differentiable models such as deep neural networks, where one has complete access to the model. In this work, we propose a method, Model Agnostic →

contrastive explanations model agnostic contrastive explanations method classification model real and categorical features pertinent positives and negatives

发现论文，激发创造

MACE：一个高效的模型无关框架用于因果解释

提出了一种新的框架 Model-Agnostic Counterfactual Explanation (MACE)，通过采用一种新设计的流水线来有效处理大量特征值上的非可分机器学习模型，其中包括使用基于 RL 的方法来找到良好的对策例子和梯度下降方法来改进相似性。公共数据集上的实验证实了该方法的有效性，具有更好的准确性、稀疏性和相似性。

May, 2022

对大型语言模型的对比解释方法

通过黑盒 / 查询访问，我们提出了两种对比解释方法：一种是效率较高但需要多次模型调用的近视算法，另一种是主要算法贡献的预算算法。我们展示了这些方法在不同自然语言任务中的有效性，例如开放文本生成、自动红队战术和解释对话衰退。

Jun, 2024

模型可解释性的对照解释

该研究提出了一种利用潜空间对分类模型进行对比解释的方法，可以对输入的文本进行高、低级别的概念和属性归纳分析，以实现更准确、细粒度的模型可解释性。

Mar, 2021

CEnt：一种基于熵的模型无关可解释性框架，用于对比分类器的决策

本论文提出了一种基于决策树、熵、对抗性生成模型等方法的可解释性算法 CEnt，能够生成种类多样性的反事实证明，不但在可行性、达成性等方面较现有方法表现更好，并且在 MNIST、Fashion MNIST 等数据集上进一步推广并成功用于文本分类器缺陷检测。

Jan, 2023

利用对比解释解读语言模型

该研究关注对语言模型的对比解释，证明对比解释在验证大型语法现象和改善对相互模拟性上是可量化地更好的，并且可以表征模型在各种语言生成决策中使用的输入令牌。

Feb, 2022

CLIMAX：分类器基于对比解释的探索

本文提出了一种名为 CLIMAX 的后操作模型无关 XAI 技术，它提供了对黑盒分类器分类的对比解释以及为什么其他类别未被预测的理由。

Jul, 2023

对比图神经网络解释

本文提出了一种基于 Distribution Compliant Explanation（DCE）的 Contrastive GNN Explanation（CoGE）技术，该技术适用于 Graph Neural Networks，并且可以提供更精确的模型解释。

Oct, 2020

宁愿是护士也不是医生 -- 对比解释的调查研究

对四个英文文本分类数据集进行分析，通过三种不同规模的模型以及三种后期解释性方法，验证了模型解释和人类解释在对比性和非对比性设置下的一致性。

Oct, 2023

GRACE: 生成简洁明了的对比样本以解释神经网络模型的预测

提出了一种名为 GRACE 的新的解释深度学习模型在表格数据方面的预测的方法，它基于干预与对比这两个思想，并生成易于理解的文本解释，相较于竞争基线方式，其生成的解释直观易懂且提高了用户决策准确性达 60%。

Nov, 2019

上下文解释网络

提出使用 CEN（contextual explanation networks）架构进行预测，生成中间简化的概率模型作为解释，为每个预测生成有效的、实例特定的解释，并可用于决策支持。CEN 架构不仅和现有的最先进方法相竞争，且在决策支持方面提供了有价值的额外细节。

May, 2017