通过中间层干扰衰减来提高对抗性可迁移性

ICMLApr, 2023

通过中间层干扰衰减来提高对抗性可迁移性

Improving Adversarial Transferability by Intermediate-level Perturbation Decay

Qizhang Li, Yiwen Guo, Wangmeng Zuo, Hao Chen

TL;DR论文提出了一种名为 ILPD 的新方法，通过单一阶段的优化过程，鼓励中间层扰动同时具有有效的对抗方向和巨大的幅度，以构建对抗性样本。实验结果表明，该方法在攻击各种受害者模型方面的性能大大优于现有技术，其中在 ImageNet 上平均提高了 10.07％，在 CIFAR-10 上平均提高了 3.88％。

Abstract

intermediate-level attacks that attempt to perturb feature representations following an adversarial direction drastically have shown favorable performance in crafting transferable adversarial examples. Existing m

adversarial examples intermediate-level attacks perturbation optimization imagenet

发现论文，激发创造

通过中间层攻击增强对抗样本的可传递性

介绍了一种名为 ILA 的攻击方法，它可以利用源模型的中间层信息对现有的对抗样本进行微调，从而提高黑盒攻击的成功率。

Jul, 2019

又一种中等级攻击

本文提出了一种通过建立中间层次的线性映射以增强基线对抗样本的黑盒可迁移性的方法，实现了在 CIFAR-100 和 ImageNet 上的实验验证以及比之前的最新技术表现强大。

Aug, 2020

基于线性回归的中级攻击框架

该论文扩展了 ECCV 中提出的中级攻击的概念，并建立了一种中级差异到预测损失的直接线性映射框架，通过许多线性回归模型的考虑，发现对抗差异的大小与迁移性有关；在此基础上，使用随机初始化多次运行基线攻击可进一步提高性能，实现了基于转移的 l∞和 l2 攻击的新的最高水平。

Mar, 2022

面向可迁移的对抗攻击与集中扰动

在频率域中进行细粒度扰动优化的可传递对抗攻击方法能够增强攻击传递性，有效绕过各种防御措施。

Dec, 2023

区域性图像扰动能够降低 $L_p$ 范数的对抗样本，同时保持模型对模型的可转移性

本研究通过使用交叉熵符号等简单方法，生成有效的区域性对抗扰动，这些局部攻击可能比非本地对抗例子需要更少的扰动，从而潜在地破坏了在 $L_p$ 范数下具有稳健性的防御。

Jul, 2020

通过特征层次扰动来提高黑盒攻击的标准和严格可转移性

该研究讨论在深度神经网络（DNN）图像分类器范围内的黑盒传递目标对抗攻击威胁模型，提出的方法通过扰动特征层级上的表示来模仿其他类别，使用灵活的攻击框架显示出 ImageNet DNNs 之间的最新目标传输性能，并说明其优越性，相比于其他黑盒传输方法，成功率提高了 10 倍，该方法胜过现有的攻击策略，并在有限的黑盒模型查询情况下同时展示了该方法的扩展性。

Apr, 2020

面向不可察觉和可迁移对抗攻击的扩散模型

论文介绍一种新型的对抗攻击方法 DiffAttack，该方法利用扩散模型的生成和判别能力，在隐空间中生成人类感知不到的、带有语义线索的扰动，并采用内容保持结构。考虑到攻击的传递性，DiffAttack 进一步 “欺骗” 扩散模型，以分散其注意力，达到更好的转移性能，实验结果表明，DiffAttack 在各种模型结构和防御方法下具有更高的攻击成功率。

May, 2023

深度特征分布的可迁移扰动

该研究提出了一种基于类别和层次深度特征分布建模和利用的新型对抗攻击方法，其可实现针对未受保护的 ImageNet 模型的最先进的有针对性的黑盒转移攻击结果，并且具有攻击过程可解释性和可解释性的优先级。

Apr, 2020

对抗性扰动欺骗深度伪造检测器

本研究使用对抗扰动来增强 Deepfake 图像，欺骗普通 Deepfake 检测器。我们使用 Fast Gradient Sign Method 和 Carlini 和 Wagner L2 范数攻击在黑盒和白盒设置中创建对抗性扰动。我们还探讨了两种深度伪造检测器的改进：1. 李普希茨正则化；2. 深度图像先验（DIP）。

Mar, 2020

通过潜在对抗扰动实现可靠的快速对抗训练

本研究提出了一种基于潜在对抗扰动的单步对抗性训练方法，通过梯度正则化来确保性能稳定，并且与现有的基于输入空间的对抗性训练方法相比，具有更高的计算效率和更好的表现。

Apr, 2021