LeGrad：通过特征形成敏感度的视觉 Transformer 可解释性方法

Apr, 2024

LeGrad：通过特征形成敏感度的视觉 Transformer 可解释性方法

LeGrad: An Explainability Method for Vision Transformers via Feature Formation Sensitivity

Walid Bousselham, Angie Boggust, Sofian Chaybouti, Hendrik Strobelt, Hilde Kuehne

TL;DR针对 Vision Transformers（ViTs）这一计算机视觉领域的标准架构在可解释性方面的挑战，提出了一种名为 LeGrad 的特定于 ViTs 的解释性方法。该方法使用自我注意机制计算与 ViT 层的注意力图相关的梯度，将梯度作为解释性信号。通过聚合所有层的信号，并结合最后一个标记和中间标记的激活，生成合并的解释性图，从而使 LeGrad 成为增强 ViTs 透明性的一种概念简单且易于实现的工具。在具有挑战性的分割、扰动和开放词汇的场景中对 LeGrad 进行评估，展示了与其他状态 - of-the-art 解释性方法相比的多功能性，展示了其更优越的空间保真度和对扰动的鲁棒性。

Abstract

vision transformers (ViTs), with their ability to model long-range dependencies through self-attention mechanisms, have become a standard architecture in computer vision. However, the interpretability of these mo

vision transformers legrad explainability self-attention mechanisms transparency

发现论文，激发创造

注意力导向 CAM：自注意力引导视觉变换器的视觉解释

我们提出了一种应用于 Vision Transformer 的注意力引导可视化方法，该方法能够为其决策提供高级语义解释，并以类标签为唯一的输入，具备出色的定位性能，在弱监督定位任务中胜过了之前领先的解释方法，并具备捕获目标类对象的完整实例的能力

Feb, 2024

ViT-ReciproCAM: 用于视觉转换器的无梯度与无注意力的视觉解释

本文提出了一种新颖的方法来解决 Vision Transformers (ViT) 在计算机视觉任务中对图像分类和目标检测等方面表现出的优异性能的预测过程理解和调试预测错误的挑战。我们提出了一种名为 ViT-ReciproCAM 的梯度无关的视觉解释方法，该方法不需要关注矩阵和梯度信息，并通过利用激活的令牌和网络预测之间的相关性来生成更局部化的显著性地图，从而在 ADCC 指标上优于现有最先进的相关性方法。实验证明了 ViT-ReciproCAM 方法的有效性，展示了其在理解和调试 ViT 模型方面的潜力，并提供了一种高效易实现的生成视觉解释的替代方法。

Oct, 2023

面向医学成像的视觉 Transformer 解释评价

本文研究了在医学影像学领域中，Vision Transformer (ViT) 解释方法的表现，证明了 Transformer 的逐层相关传播法胜过本地可解释的模型不可知性解释和注意力可视化方法，在准确和可靠地表示 ViT 已经学到了什么方面提供了更好的表现。

Apr, 2023

GradViT: Vision Transformers 的梯度反演

该论文展示了视觉转换器（ViTs）对基于渐变的反演攻击的易受攻击性。作者提供了一种名为 GradViT 的方法，可以将随机噪声优化为自然图像，以通过迭代过程重建原始数据批次。作者发现 Vision Transformers 由于注意机制的存在，比之前研究过的 CNNs 容易受到攻击。作者的方法具有卓越的定量与定性表现。

Mar, 2022

基于 Transformer 的可解释多摄像头 3D 物体检测与显著性图

我们提出了一种新颖的方法，用于生成用于 3D 物体检测的具有多个相机输入的 DetR-like ViT 的显著性图。我们的方法基于原始注意力，比基于梯度的方法更高效。通过大量的扰动测试，我们在 nuScenes 数据集上评估了所提出的方法，并展示了其在视觉质量和定量指标方面优于其他可解释性方法。我们还展示了在转换器的不同层之间聚合注意力的重要性。我们的工作有助于开发 ViT 的可解释 AI，通过更透明地了解 AI 模型的内部工作，可以提高人们对 AI 应用的信任。

Dec, 2023

基于 Token 梯度正则化的可转移的视觉 Transformer 的对抗攻击

本篇论文提出了一种名为 Token Gradient Regularization（TGR）的方法，通过在每个内部块中以 token 方式减少 ViTs 反向传播梯度的方差来生成对抗样本，从而攻击 Vision transformers 和 CNNs，并对比现有的迁移攻击方式，在性能上提供了平均 8.8% 的改善。

Mar, 2023

概率概念解释器：用于视觉基础模型的可信概念解释

这篇论文提出了 Vision transformers（ViTs）在解释方法方面的需求，通过引入概率概念解释器（PACE）来提供可信的事后概念解释，并通过实验表明 PACE 在定义的需求方面优于现有方法。

Jun, 2024

可解释感知视觉变换器

我们引入了一种新的培训过程，通过训练促进模型的可解释性，从而解决 Vision Transformers 在解释性方面的不足，并提出了 IA-ViT 模型，通过单头自注意机制提供忠实的解释，有效地应用于几个图像分类任务。

Sep, 2023

使用特征多样性对抗攻击变形器

提出了一种用于 Vision Transformer 模型的无标签白盒攻击方法，该方法在各种黑盒模型之间表现出较强的迁移性，包括大多数 Vision Transformer 变体、CNN 和 MLP，甚至是针对其他模态开发的模型。攻击的灵感来自于 Vision Transformer 中的特征重叠现象，其中关键的注意力机制过度依赖于特征的低频成分，导致中 - 末层的特征趋向相似并最终崩塌。提出的特征多样性攻击者可以自然加速这一过程，达到卓越的性能和可转移性。

Mar, 2024

探索可变自编码器的可视化解释

本文提出了一种基于梯度的注意力机制技术，用于解释变分自编码器（VAE）及其预测，该技术通过生成学习到的潜在空间的视觉注意力，可用于图像中异常的定位，并能融入模型训练来帮助改善潜在空间分解，这在 MVTec-AD 和 Dsprites 数据集上表现出了最先进的性能。

Nov, 2019