渐进式夸张解释

Nov, 2019

Explanation by Progressive Exaggeration

Sumedha Singla, Brian Pollack, Junxiang Chen, Kayhan Batmanghelich

TL;DR本文提出了一种基于类的语义扩张的方法，该方法可以解释分类黑盒模型的结果，是模型无关的，并且只需要输出值和预测器相对于其输入的梯度。

Abstract

As machine learning methods see greater adoption and implementation in high stakes applications such as medical image diagnosis, the need for model interpretability and explanation has become more critical. Classical approaches that assess feature importance (e.g. saliency maps) do not

machine learning model interpretability classification black-box counter-factually generated samples decision boundary

发现论文，激发创造

平滑解释黑匣子 —— 反事实方法

该研究提出了一种黑盒对抗解释器来解释医学应用中的图像分类模型，并通过对诊断放射学居民进行实验，发现反事实解释是唯一能显着提高用户对分类器决策理解的解释方法。

Jan, 2021

通过有意义的扰动提供黑匣子的可解释性解释

该研究提出了一种适用于任何黑盒机器学习算法的通用解释框架，并将其特化以找到对分类器决策最负责的图像部分。该方法是模型无关且可测试的，因为它基于明确且可解释的图像扰动。

Apr, 2017

可解释的深度泛化领域分类模型

AI 模型的可解释性通常会因降低准确性而受到质疑。我们开发了一种训练策略，不仅提高了目标分类方案的解释性，同时并未降低准确性，实现方式是对决策网络作出决策的可视证据进行区域定位，其表示方法为表征哪些像素对网络决策的贡献最大的显著性图。我们的训练策略通过使模型集中于直接对应于地面目标的图像区域的反馈，在自动和人工指标的量化中量化可解释性，并提出了可解释性作为弥合不同域之间视觉 - 语义差距的手段。我们证明，这种方法不仅提高到新领域的泛化性能，而且不会影响在原始领域上的性能。

Mar, 2020

重新思考用户研究设计以评估模型解释

该研究通过一个众包实验，探讨解释机器学习模型的预测对人类是否具有帮助，并发现在给定特征系数的情况下，人们能够更有效地对线性词袋模型进行操纵，但解释对 BERT 型分类器并没有显著提高操纵能力，而通过伪造 BERT 模型的线性模型的对全局归属的解释则可以有效地操作 BERT 型模型。

Dec, 2021

你看到的就是你分类的：黑盒归因

在黑盒神经网络的基础上，通过训练第二个网络来预测对预备的黑盒分类器的贡献，并将这些贡献以只显示与分类器相关部分的蒙版的形式提供，我们的方法可以直接在单个前向传递中生成非常明显的类特定蒙版。

May, 2022

利用潜在特征进行本地解释

本研究探讨了一种利用潜在特征产生对照解释的新方向，通过添加新特征改变分类结果的方法进行预测的解释，证明了该方法在样本丰富的数据集上产生的直观解释优于其他方法，并可作为目前最先进的解释性方法的补充。

May, 2019

可解释的网络可视化：基于人机协同的 CNN 图像分类后续解释方法

通过引入一种后置方法，我们解释了卷积神经网络的整个特征提取过程，并包含了一组通过众包活动和自然语言处理技术提取并处理的文本标签，在多幅图像中聚合标签以生成全局解释。

May, 2024

相关无关性：为图像分类器生成对抗性解释

本文介绍了一种基于生成对抗网络 (GAN) 的方法，用于生成可以解释神经网络黑盒模型的替代性解释，进一步通过用户研究验证了替代性解释与反事实解释相辅相成。

May, 2024

借助真实样本的渐进邻域逼近解释文本分类器

针对文本分类器的局部模型无关解释，提出了一种渐进逼近方法，它通过两阶段插值使用反事实来完善待解释决策的领域，从而提高了邻域质量。通过试验，证明了该方法的有效性。

Feb, 2023

面向深度神经网络可视化的区域多尺度方法

该论文提出了一种基于区域的方法来估计图像中特征的重要性，利用多尺度分割产生更具类别区分度和视觉效果的显著图，通过对输入图像进行多尺度分割来构建一个正态分布，并对边界先验进行仿真，证明该方法比传统方法更有效。

Jul, 2018