DISSECT: 通过概念遍历进行解释的分离式同时解释

May, 2021

DISSECT: 通过概念遍历进行解释的分离式同时解释

DISSECT: Disentangled Simultaneous Explanations via Concept Traversals

Asma Ghandeharioun, Been Kim, Chun-Liang Li, Brendan Jou, Brian Eoff...

TL;DR这篇论文提出了一种名为DISSECT的新方法，该方法可以有效地实现生成解释、概念解缠、反事实解释、可解释性和偏见检测等课题。该方法使用少量监督同时训练生成器、鉴别器和概念解缠器，通过生成分类器辨别信号的生成模型，能够自动发现分类器固有的不同概念。应用该方法能够检测分类器的潜在偏见和识别影响预测的虚假因素。

Abstract

Explaining deep learning model inferences is a promising venue for scientific understanding, improving safety, uncovering hidden biases, evaluating fairness, and beyond, as argued by many scholars. One of the principal benefits of counterfactual explanations is allowing users to explor

发现论文，激发创造

无监督学习中解开表征的常见假设的挑战

本文分析了无监督学习分离表示的最新进展并挑战了一些常见假设，通过实验研究发现，不加监督训练的模型很难达到良好的分离效果，同时，增加分离度似乎不会降低学习的样本复杂度，未来的研究应该关注归纳偏置和(隐式)监督的作用，考虑在多个数据集上复现实验结果。

Nov, 2018

利用图像翻译生成反事实来进行科学发现

通过解释技术，提出了一种将解释转换为科学探索机制的框架，并证明结合黑盒预测器和生成模型可以用于生成无人类先验条件的假设，该技术用于糖尿病黄斑水肿的分类模型，成功连接模型的性能和人类理解。

Jul, 2020

解缠一统天下？概念与解缠方法的比较

本文对概念解释和解纠缠学习领域的研究进行了比较和对比，探讨了它们在各种任务上的性能和行为，以及它们的潜在优势和局限性，并指出两者的最新方法在数据效率、特定分类/回归任务的敏感性，或所使用的概念表示符号的敏感性等方面存在局限性。

Apr, 2021

后验概念解释何时可辨识？

该研究提出可识别地探索嵌入空间的概念，是在没有人类标签的情况下，通过搜索训练的嵌入空间中可解释的概念，比如物体的形状或颜色来提供后续的决策解释。通过展示PCA和ICA能够恢复非高斯分布的独立概念，再提出两种基于图像生成模型可组合性的方法来恢复相关概念，该研究提供了没有人类标签可靠概念发现的坚实基础。

Jun, 2022

面向概念表示评估的鲁棒度量方法

本文介绍了在 deep learning 模型的 concept-based explanations 框架下使用 disentanglement learning 模型的相关指标来评估 concept representations 的纯度，并验证了这些新指标的有效性和它们在评估纯度、干预和基准测试等方面的实用性。

Jan, 2023

使用多路径归因映射改善解释独立表示

该论文提出了一个框架，利用可解释的分离表示来进行下游任务预测，并通过可视化分离表示来加强和验证解释，从而在卫生保健的临床诊断中降低由于因果关系错误而导致的危险选择和提高模型的鲁棒性。

Jun, 2023

通过潜在空间分解揭示独特的概念向量

该论文提出一种后期无监督方法，通过分解和聚类方法，自动发现深度学习模型中的概念向量，从而支持可解释性分析，可以成功鉴别与疏离数据有关的训练样本

Jul, 2023

DiConStruct: 基于因果概念的黑盒压缩解释

DiConStruct是一种基于概念和因果关系的解释方法，目的是通过结构性因果模型和概念归因来创建更可解释的局部解释，并有效地近似黑盒机器学习模型的预测，而不影响预测任务。

Jan, 2024

利用反事实推理的因果生成解释器：以Morpho-MNIST数据集为案例研究

提出使用因果生成学习作为解释图像分类器的可解释工具，利用生成对事实推理方法研究视觉特征和因果因素对分类器决策的影响，提供了针对可解释因果数据集的对抗解释方法，通过与OmnixAI开源工具进行对比，发现我们的方法提供的对事实解释更可解释，适用于生成高度可解释的对事实解释。

Jan, 2024

少即是多：发现简明网络解释

提出一种新的方法，通过生成人可理解的视觉解释来增强深度神经图像分类器的可解释性，并且该方法通过同时优化三个标准：解释应该少、多样化和可理解，以自动找出区分类别的关键视觉解释。

May, 2024