在图像表征中识别可解释子空间

ICMLJul, 2023

Identifying Interpretable Subspaces in Image Representations

Neha Kalibhat, Shweta Bhardwaj, Bayan Bruss, Hamed Firooz, Maziar Sanjabi...

TL;DR我们提出了一种利用对比概念的自动特征解释（FALCON）的可解释性框架来解释图像表示的特征，通过使用大规模字幕数据集（如 LAION-400m）和预训练的视觉 - 语言模型（如 CLIP），FALCON 对高度活化的裁剪图像进行字幕，并得出一些共享的、人可理解的概念，从而解释目标特征。FALCON 还使用低激活的（反事实的）图像进行对比解释，以消除虚假概念。我们展示了当在组中研究时，比如在最先进的无监督和有监督模型中观察到，少于 20% 的表示空间可以通过单独的特征解释。我们通过 FALCON 展示了在更大的空间中研究的特征更具解释性，并且可以通过高阶计分概念来解释。我们讨论了如何使用提取的概念来解释和调试下游任务中的失败。最后，我们提出了一种通过学习简单的线性变换，将概念从一个（可解释的）表示空间转移到另一个未见的表示空间的技术。

Abstract

We propose automatic feature explanation using Contrasting Concepts (falcon), an interpretability framework to explain →

automatic feature explanation interpretability framework image representations features falcon

发现论文，激发创造

FALCON：通过整合图像、语言描述和概念相关性快速进行视觉概念学习

该文提出了一种元学习框架，通过同时观察图片、阅读描述场景中对象的句子和解释补充句子等多个自然出现的数据流来快速学习新的视觉概念，支持问答等应用，其模型命名为 FALCON，使用方框嵌入空间表示视觉概念，包括颜色和形状，并利用关系推理技术推理出未知视觉概念的最优方框嵌入。

Mar, 2022

基于概念的视觉解释的无监督可解释基础提取

本文提出了一种无监督的后期方法，通过查找解释稀疏的一个阈值转换表示的像素激活的特征空间旋转来提取可解释的基础，并在现有流行的 CNNs 上进行实验，证明了本方法提取可解释基础的有效性。此外，通过基础可解释性度量，将中间层表示转换为我们方法提取的基础，从而使中间层表示更具可解释性。最后，我们将提取的基础与监督方法提取的基础进行比较，并发现无监督方法具有优势，为未来的研究提供了潜在方向。

Mar, 2023

通过潜在空间分解揭示独特的概念向量

该论文提出一种后期无监督方法，通过分解和聚类方法，自动发现深度学习模型中的概念向量，从而支持可解释性分析，可以成功鉴别与疏离数据有关的训练样本

Jul, 2023

基于语言的动作概念空间改进视频自监督学习

使用自监督学习方法，对图像 CLIP 模型进行语言约束的调整，以适应视频领域，提高三个行动识别基准测试的零样本和线性探测性能。

Jul, 2023

理解概念激活向量：解释可解释性

使用概念解释将深度学习模型的内部表示转化为人类熟悉的语言，最近的解释性方法提议采用基于概念的解释。本文研究了 Concept Activation Vectors (CAVs) 的三个性质，它们可能在不同层次之间存在不一致性，与不同概念纠缠在一起，并具有空间依赖性，这些性质为解释模型提供了挑战和机会。同时，我们还介绍了工具来检测这些性质的存在，并提供洞见以了解它们对解释的影响，并提出减小它们影响的建议。通过理解这些性质，我们可以利用它们的优势。例如，我们引入了具有空间依赖性的 CAVs 来测试模型在特定概念和类别上是否具有平移不变性。我们在 ImageNet 和一个新的合成数据集 Elements 上进行实验。Elements 旨在捕捉概念与类别之间已知的真实关系。我们发布此数据集以促进对解释性方法的进一步研究和评估。

Apr, 2024

利用生成模型对无监督概念为基础的可解释网络进行重新设计

通过将概念特征映射到预训练生成模型的潜在空间中，我们提出了一种新方法，以生成高质量的可视化结果并提供直观、交互式的解释方式。我们验证了该方法在可解释预测网络准确性、重构保真度以及概念学习的忠实性和一致性方面的有效性。

Jul, 2024

使用概念定位图解释基于人工智能的决策支持系统

本篇论文提出了一种基于图像分类器的理解性决策支持系统 (DSS) -- 概念定位地图 (CLMs)，它能够增强分类器的可靠性并提供合理的预测解释。通过在训练的图像分类器的潜在空间中定位相应的显著区域，CLMs 可以提供分类器学习和关注人类在图像识别过程中所注重的相似概念的定性和定量保证。研究人员通过一项新的合成数据集 SCDB 和一个现实世界数据集 CelebA 对其进行了评估，并获得了较高的定位召回率，证明了 CLMs 在实践中缓解 DSS 受重视度方面具有巨大的潜力。

May, 2020

概念发现的稀疏子空间聚类 (SSCCD)

通过稀疏子空间聚类的方法，探究概念基础解释和概念子空间作为深度学习模型行为的关键组成部分，从而更深入地理解模型行为。

Mar, 2022

FALCON: 基于 ALC 本体的神经语义蕴含模型

使用模糊逻辑算子生成任意 ALC 本体的模型结构并使用多个模型结构计算语义蕴涵，FALCON 可以实现对 ALC 本体的近似语义蕴涵，从而赋予神经网络世界模型和推理能力，提升生物医学领域中的机器学习。

Aug, 2022

通过诱导符号空间进行可解释的视觉推理

该研究旨在通过目标 - 中心的组合式注意力模型（OCCAM）和符号概念空间，从与图像相关的问题 - 答案对中识别概念和它们的分层关系，并实现一个可解释的模型。该模型通过设计新的 OCCAM 框架执行视觉推理任务，并提出一种方法，从对象的视觉特征和问题词之间的注意力模式中使用线索，诱导对象和关系的概念。结果表明，OCCAM 在无需人类注释的功能程序的情况下取得了最新的技术水平，并且所诱导的概念精确而充足，在视觉特征或在引入的符号概念空间中表示的对象上都能够取得相当的性能。

Nov, 2020