攻击基准：对于对抗性样本的基于梯度的攻击评估

Apr, 2024

攻击基准：对于对抗性样本的基于梯度的攻击评估

AttackBench: Evaluating Gradient-based Attacks for Adversarial Examples

Antonio Emanuele Cinà, Jérôme Rony, Maura Pintor, Luca Demetrio, Ambra Demontis...

TL;DR我们提出了 AttackBench 作为第一个用于评估对抗样本优化的攻击的公平比较框架，通过分类梯度攻击、定义优化度量标准和限制查询次数等方式评估攻击的效果和效率，并通过对超过 100 种攻击实现在 CIFAR-10 和 ImageNet 模型上的 800 多种不同配置的实证分析，发现只有很少的攻击能够超越所有其他竞争方法，同时揭示了阻碍许多攻击找到更好解决方案或运行的几个实现问题，我们将 AttackBench 作为一个公开可用的基准，并致力于不断更新以包含和评估新的梯度攻击方法。

Abstract

adversarial examples are typically optimized with gradient-based attacks. While novel attacks are continuously proposed, each is shown to outperform its predecessors using different experimental setups, hyperpara

adversarial examples gradient-based attacks evaluation framework attackbench optimizing adversarial examples

发现论文，激发创造

精准、可靠、快速的鲁棒性评估

在神经网络的研究中，我们开发了一种新的梯度基础的对抗攻击方法，相较于已有的攻击方法，它更可靠，可以适应广泛的对抗标准，并且在提高效率的同时，不需要进行超参数调整，这将对神经网络的鲁棒性评估做出有益的贡献。

Jul, 2019

GenAttack：基于梯度自由优化的实用黑盒攻击

这篇论文提出了 GenAttack—— 一种基于遗传算法的无梯度黑盒对抗攻击优化技术，在 MNIST、CIFAR-10 和 ImageNet 数据集上成功地生成了对抗性样本，攻击了最新的图像识别模型，且所需的查询量比之前的攻击方法少了几个数量级，且还能攻击一些针对对抗性训练的防御措施，通过实验证明了遗传算法在黑盒攻击研究中的可行性和前景。

May, 2018

对抗鲁棒性基准测试

本研究旨在建立一个全面、严谨、连贯的标准来评估对抗性鲁棒性，通过两个鲁棒性曲线作为公正的评估标准来进行大规模实验，全面掌握攻击与防御方法的表现并得出重要结论和未来研究的启示。

Dec, 2019

系统性、实践性和公正性地评估基于传递的攻击

该论文探讨了深度神经网络（DNNs）的对抗性脆弱性，并建立了一个基于转移的攻击基准（TA-Bench）来评估和比较 30 多种方法在 ImageNet 上的 25 个受害模型，从而提供了这些方法的有效性新见解和未来评估的指导。

Nov, 2023

探索对深度神经网络的黑箱攻击空间

提出了一种新的基于梯度估计的黑盒攻击方法，攻击者可以查询目标模型的类概率，无需使用可转移性。该攻击在 MNIST 和 CIFAR-10 数据集上的攻击成功率均超过 100％，同时成功攻击了 Clarifai 的实时图像分类器和最新防御方法。

Dec, 2017

高效组合优化的简约黑盒对抗攻击

本文提出了一种离散替代方法来解决黑匣子攻击的问题，该方法可以在不需要估计导数的情况下有效地攻击神经网络，降低了之前所提出方法所需的查询次数。

May, 2019

可转移对抗攻击的基准评估

本研究首次详细审查了对抗性攻击的可转移性方面，系统地分类和评估了各种用于增强对抗性攻击可转移性的方法学。同时，本文引入了一个基准框架 TAA-Bench，集成了十种领先的对抗性攻击可转移性方法，为跨不同模型结构的比较分析提供了一种标准化和系统化的平台。通过全面审查，我们描述了每种方法的有效性和限制，并揭示了它们的操作原理和实际效用，旨在成为该领域学者和实践者的基本资源，为对抗性可转移性的复杂领域绘制地图并为未来的探索奠定基础。

Feb, 2024

利用对抗梯度方向进行对抗样本检测，战胜攻击者

提出了一种基于对抗梯度方向的对抗示例检测方法，用于识别特制的输入，以欺骗机器学习分类器，此方法仅应用一个随机扰动对输入示例进行检测，实验表明，相比使用多个扰动的检测方法，该方法在对抗攻击方面表现更好。在多个数据集上的实验表明，该方法相应的 AUC-ROC 值为 97.9％和 98.6％，并且胜过了多种其他顶尖的检测方法。

Dec, 2020

一种高效且有效的对抗攻击的 Frank-Wolfe 框架

本文提出一种基于 Frank-Wolfe 算法的新型优化算法框架，可同时用于白盒和黑盒情况下的对抗攻击，并表示该算法具有高效性、有效性和优越的性能。

Nov, 2018

一个标准的对抗鲁棒性基准测试 RobustBench

为了建立标准化的对抗性鲁棒性基准，我们考虑了图片分类任务，并引入了允许的模型限制，使用 AutoAttack 进行评估，同时提供 80 多种鲁棒模型的开源库，分析了鲁棒性对分布偏移、平滑性等性能的影响。

Oct, 2020