平滑边缘扰动改善基于扰动的图像解释

Sep, 2024

平滑边缘扰动改善基于扰动的图像解释

Smooth-edged Perturbations Improve Perturbation-based Image Explanations

Gustav Grund Pihlgren, Kary Främling

TL;DR本研究针对现有图像预测模型解释方法的不足，探讨了扰动掩码的不同组合及其对解释效果的影响。研究表明，RISE方法中的像素归因对所有评估方法均有益，且归因计算对结果的影响最小。该研究为优化图像解释提供了重要见解。

Abstract

Perturbation-based post-hoc Image Explanation methods are commonly used to explain image prediction models by perturbing parts of the input to measure how those parts affect the output. Due to the intractability of perturbing each pixel individually, images are typically attributed to

发现论文，激发创造

语义分割和分类的自我纠正扰动

本篇论文探究了卷积神经网络中的一种新行为：通过结构化扰动输入，预训练的CNN可以改善其预测性能，这种扰动被称为Guided Perturbations。实验结果表明，这种方法可以提高现有方法在语义分割和场景标注任务上的性能，并且可以应用于MNIST和CIFAR10等数据集上的分类任务。

Mar, 2017

通过有意义的扰动提供黑匣子的可解释性解释

该研究提出了一种适用于任何黑盒机器学习算法的通用解释框架，并将其特化以找到对分类器决策最负责的图像部分。该方法是模型无关且可测试的，因为它基于明确且可解释的图像扰动。

Apr, 2017

适应性梯度用于对抗性扰动生成

深度神经网络在计算机视觉、自然语言处理和音频任务中取得了显着的成功。

Feb, 2019

通过极值扰动和平滑蒙版理解深度网络

本文探讨了现有扰动分析方法的一些缺点，并通过引入理论上坚实和可解释的极值扰动的概念来解决这些缺点。我们还介绍了一些技术创新来计算极值扰动，包括一个新的面积约束和一个参数化的平滑扰动系列，这些使我们能够从优化问题中去除所有可调超参数。我们分析了扰动的影响作为它们的面积的函数，展示了在刺激下深度神经网络的空间属性方面的出色灵敏度。我们还将扰动分析扩展到网络的中间层。最后，我们介绍了TorchRay，这是一个基于PyTorch构建的可解释性库。

Oct, 2019

随机平滑通过认证防御图像变换

本文提出了将随机平滑算法推广至包括参数化变换以及在参数空间中进行鲁棒性证明的方法，并通过引入三种不同类型的防御机制（启发式的，分布式的和个人的保证），解决了插值和舍入效应导致图像变换不组合的问题。此外，我们还展示了如何通过统计误差限制或图像变换的高效在线逆计算来获得个人证书。

Feb, 2020

为鲁棒机器学习学习扰动集合

本研究旨在通过从数据中学习扰动集，以便对鲁棒性进行训练和评估，从而缩小实际世界中的扰动和通常研究的更窄定义的集合之间的差距。使用条件生成器定义扰动集，并使用理想特性来衡量学习的扰动集的质量，理论上证明了条件变分自动编码器自然满足这些标准。最后，使用学习的扰动集来训练模型，使其对敌对图像污染和敌对光线变化具有实证和可证明的鲁棒性，并提高非敌对数据的泛化。

Jul, 2020

学习传播规则用于生成归因图

提出使用可学习插件模块生成归因图的方法，用于在非线性层的反向传播过程中自动学习传播规则，该方法在五个数据集和六个网络架构上实现了最先进的结果。

Oct, 2020

关于扰动和梯度解释的统一和鲁棒性

研究了两种流行的机器学习解释技术：基于梯度的SmoothGrad方法和一种基于扰动的LIME方法，并通过数学推导证明它们在期望上产生相同的解释。通过在合成和真实世界数据集上进行广泛实验验证了理论模型。

Feb, 2021

扰动辅助样本合成：一种新的不确定性量化方法

本文介绍了一种新型生成器 PASS (Perturbation-Assisted Sample Synthesis)，用于处理复杂数据，并结合利用预训练的生成模型进行统计推断，实现了可靠的数据估算。作者还提出了一种名为 PAI (Perturbation-Assisted Inference) 的生成推断框架，在三个领域应用得到了很好的效果。

May, 2023

缺失图像修复: 一种评估视觉转换解释方法的新框架

借助“Inpainting the Gaps（InG）”这一创新的评估框架，针对计算机视觉领域中的解释方法，本研究通过修复图像中的空缺部分，降低测试时间分布漂移，提高了扰动测试的效果，并在Vision Transformer（ViT）的三种训练策略上进行了 PartImageNet 数据集的评估，发现 Beyond Intuition 和 Generic Attribution 是最一致的解释模型，此外，该框架还在所有考虑的 ViT 模型中得到了更高和更一致的评估分数。在我们所了解的范围内，InG 是评估 ViT 解释方法的第一个半合成框架。

Jun, 2024