平滑边缘扰动改善基于扰动的图像解释
本篇论文探究了卷积神经网络中的一种新行为:通过结构化扰动输入,预训练的CNN可以改善其预测性能,这种扰动被称为Guided Perturbations。实验结果表明,这种方法可以提高现有方法在语义分割和场景标注任务上的性能,并且可以应用于MNIST和CIFAR10等数据集上的分类任务。
Mar, 2017
该研究提出了一种适用于任何黑盒机器学习算法的通用解释框架,并将其特化以找到对分类器决策最负责的图像部分。该方法是模型无关且可测试的,因为它基于明确且可解释的图像扰动。
Apr, 2017
本文探讨了现有扰动分析方法的一些缺点,并通过引入理论上坚实和可解释的极值扰动的概念来解决这些缺点。我们还介绍了一些技术创新来计算极值扰动,包括一个新的面积约束和一个参数化的平滑扰动系列,这些使我们能够从优化问题中去除所有可调超参数。我们分析了扰动的影响作为它们的面积的函数,展示了在刺激下深度神经网络的空间属性方面的出色灵敏度。我们还将扰动分析扩展到网络的中间层。最后,我们介绍了TorchRay,这是一个基于PyTorch构建的可解释性库。
Oct, 2019
本文提出了将随机平滑算法推广至包括参数化变换以及在参数空间中进行鲁棒性证明的方法,并通过引入三种不同类型的防御机制(启发式的,分布式的和个人的保证),解决了插值和舍入效应导致图像变换不组合的问题。此外,我们还展示了如何通过统计误差限制或图像变换的高效在线逆计算来获得个人证书。
Feb, 2020
本研究旨在通过从数据中学习扰动集,以便对鲁棒性进行训练和评估,从而缩小实际世界中的扰动和通常研究的更窄定义的集合之间的差距。使用条件生成器定义扰动集,并使用理想特性来衡量学习的扰动集的质量,理论上证明了条件变分自动编码器自然满足这些标准。最后,使用学习的扰动集来训练模型,使其对敌对图像污染和敌对光线变化具有实证和可证明的鲁棒性,并提高非敌对数据的泛化。
Jul, 2020
研究了两种流行的机器学习解释技术:基于梯度的SmoothGrad方法和一种基于扰动的LIME方法,并通过数学推导证明它们在期望上产生相同的解释。通过在合成和真实世界数据集上进行广泛实验验证了理论模型。
Feb, 2021
本文介绍了一种新型生成器 PASS (Perturbation-Assisted Sample Synthesis),用于处理复杂数据,并结合利用预训练的生成模型进行统计推断,实现了可靠的数据估算。作者还提出了一种名为 PAI (Perturbation-Assisted Inference) 的生成推断框架,在三个领域应用得到了很好的效果。
May, 2023
借助“Inpainting the Gaps(InG)”这一创新的评估框架,针对计算机视觉领域中的解释方法,本研究通过修复图像中的空缺部分,降低测试时间分布漂移,提高了扰动测试的效果,并在Vision Transformer(ViT)的三种训练策略上进行了 PartImageNet 数据集的评估,发现 Beyond Intuition 和 Generic Attribution 是最一致的解释模型,此外,该框架还在所有考虑的 ViT 模型中得到了更高和更一致的评估分数。在我们所了解的范围内,InG 是评估 ViT 解释方法的第一个半合成框架。
Jun, 2024