BruSLeAttack：一种查询高效的基于评分的黑盒稀疏对抗攻击

ICLRApr, 2024

BruSLeAttack：一种查询高效的基于评分的黑盒稀疏对抗攻击

BruSLeAttack: A Query-Efficient Score-Based Black-Box Sparse Adversarial Attack

Viet Quoc Vo, Ehsan Abbasnejad, Damith C. Ranasinghe

TL;DR我们研究了通过观察模型查询的基于分数回复而生成稀疏对抗样本的独特且不太被理解的问题。我们提出了 BruSLeAttack 这一更快（更高效）的贝叶斯算法，用于构建稀疏对抗扰动，并在图像分类任务中达到了最先进的攻击成功率和查询效率，从而帮助更快地评估模型的漏洞性，提高我们对部署系统的安全性和可靠性的警觉。

Abstract

We study the unique, less-well understood problem of generating sparse adversarial samples simply by observing the score-based replies to model queries. sparse attacks aim to discover a minimum number-the l0 bounded-perturbations to model inputs to craft adversarial examples and misgui

sparse adversarial samples sparse attacks brusleattack bayesian algorithm model vulnerabilities

发现论文，激发创造

针对黑盒深度学习模型的高效决策稀疏攻击

本文针对深度学习模型的脆弱性与展开的攻击方式，研究了基于模型决策的稀疏攻击，提出了 SparseEvo 算法，并将其应用于卷积深度神经网络和视觉 Transformer 等模型上进行评估。SparseEvo 与之前的算法相比具有更高的攻击效率，但仍需要进一步探究，以增强模型安全性。

Jan, 2022

Sparse-RS: 一种用于高效查询稀疏黑盒对抗攻击的通用框架

提出了一种基于随机搜索的多用途框架 Sparse-RS，可用于黑盒设置下的基于得分的稀疏目标攻击和非目标攻击，并达到了多个稀疏攻击模型的最先进的成功率和查询效率。

Jun, 2020

基于硬标签的小样本黑盒对抗攻击

提出了一种新的针对硬标签的黑盒攻击的优化方法，利用经预训练的替代模型指导优化过程，实验证明该方法在不同目标模型架构下显著提高了攻击的查询效率，攻击成功率较基准测试提高了约 5 倍，特别是在 100 和 250 个查询预算下。

Mar, 2024

子空间攻击：利用有前途的子空间进行查询高效黑盒攻击

本文介绍如何在黑箱攻击中利用参考模型的梯度来降低查询复杂度，提高黑箱攻击的效率和成功率，实验结果表明，与现有技术相比，本文提出的方法可以在查询数量上获得 2x 到 4x 的降低，并且具有更低的失败率。

Jun, 2019

简单黑盒对抗攻击

本文介绍了一个基于连续数值置信度分数的、高效构建黑盒中敌对图像的简单迭代算法，并且该算法同样适用于有目标和无目标攻击。作者使用少于 20 行的 PyTorch 代码在 Google Cloud Vision API 中展示了该算法的高效和有效性。

May, 2019

低查询预算环境中，简单高效且硬标签黑盒对抗攻击

提出了一种使用贝叶斯优化来进行黑盒攻击的方法，通过在结构性低维子空间中搜索对抗样本来避免 BO 在高维度下的性能问题，实验结果显示该方法相较现有黑盒攻击算法需要更少的查询次数，并且攻击成功率提高了 2 到 10 倍。

Jul, 2020

稀疏且不易察觉的对抗攻击

本文提出了一种基于黑盒技术的新型对抗样本攻击方法，针对原始图像最小化 l0 距离。实验证明，该攻击方法优于或与现有技术相当。同时，我们可引入部件约束来提高分类器对稀疏和不可察觉的对抗性操纵的鲁棒性。

Sep, 2019

基于投影与概率的黑盒攻击

通过压缩感知和概率驱动策略，利用少量请求达到更好的优化效果，从而解决黑盒攻击中存在的过多请求的问题，并在与其他攻击方法比较后证明其具有更高的攻击成功率。

May, 2020

基于可转移模型嵌入的黑盒对抗攻击

本文提出了一种新的黑盒对抗攻击方法，通过使用预训练模型学习低维嵌入，然后在此嵌入空间内进行高效搜索，从而攻击未知目标网络。该方法能够生成具有高级语义模式的对抗性扰动，易于迁移，可大大提高黑盒对抗攻击的查询效率。作者在 MNIST、ImageNet 和 Google Cloud Vision API 上进行评估，并在 CIFAR10 和 ImageNet 上攻击对抗性防御网络，取得了良好的攻击效果。

Nov, 2019

基于贝叶斯优化的黑盒对抗攻击

文章研究黑盒对抗攻击问题，提出了一种基于贝叶斯优化的高效查询算法，使用维度上采样技术优化了对深度学习模型的优化，并取得了比其他算法更优的效果。

Sep, 2019