高效组合优化的简约黑盒对抗攻击

ICMLMay, 2019

高效组合优化的简约黑盒对抗攻击

Parsimonious Black-Box Adversarial Attacks via Efficient Combinatorial Optimization

Seungyong Moon, Gaon An, Hyun Oh Song

TL;DR本文提出了一种离散替代方法来解决黑匣子攻击的问题，该方法可以在不需要估计导数的情况下有效地攻击神经网络，降低了之前所提出方法所需的查询次数。

Abstract

Solving for adversarial examples with projected gradient descent has been demonstrated to be highly effective in fooling the neural network

adversarial examples projected gradient descent neural network black-box setting query access

发现论文，激发创造

高效率黑盒对抗样本查询（已被取代）

本文提出了一种新的方法，利用自然进化策略在黑盒攻击下生成可靠的对抗样本，并通过新的算法在部分信息下进行有针对性的攻击，无需使用梯度，可以使用少量的请求操作，成功地对商业部署的机器学习系统进行了第一次有针对性的攻击。

Dec, 2017

GenAttack：基于梯度自由优化的实用黑盒攻击

这篇论文提出了 GenAttack—— 一种基于遗传算法的无梯度黑盒对抗攻击优化技术，在 MNIST、CIFAR-10 和 ImageNet 数据集上成功地生成了对抗性样本，攻击了最新的图像识别模型，且所需的查询量比之前的攻击方法少了几个数量级，且还能攻击一些针对对抗性训练的防御措施，通过实验证明了遗传算法在黑盒攻击研究中的可行性和前景。

May, 2018

探索对深度神经网络的黑箱攻击空间

提出了一种新的基于梯度估计的黑盒攻击方法，攻击者可以查询目标模型的类概率，无需使用可转移性。该攻击在 MNIST 和 CIFAR-10 数据集上的攻击成功率均超过 100％，同时成功攻击了 Clarifai 的实时图像分类器和最新防御方法。

Dec, 2017

基于贝叶斯优化的离散序列数据黑盒对抗攻击的高效查询和可扩展性

本文提出了一种使用贝叶斯优化方法对黑盒序列数据模型进行查询有效的对抗样本攻击，有效地提高了攻击成功率并且减小了查询次数和修改率。

Jun, 2022

一种查询效率高的硬标签黑盒攻击：基于优化的方法

本文提出一种用于攻击离散和非连续的机器学习模型的新方法，将难标记黑盒攻击转化为实值优化问题，并且在 MNIST，CIFAR 和 ImageNet 数据集上展示出比现有方法更优异的表现。

Jul, 2018

简单黑盒对抗攻击

本文介绍了一个基于连续数值置信度分数的、高效构建黑盒中敌对图像的简单迭代算法，并且该算法同样适用于有目标和无目标攻击。作者使用少于 20 行的 PyTorch 代码在 Google Cloud Vision API 中展示了该算法的高效和有效性。

May, 2019

基于贝叶斯优化的黑盒对抗攻击

文章研究黑盒对抗攻击问题，提出了一种基于贝叶斯优化的高效查询算法，使用维度上采样技术优化了对深度学习模型的优化，并取得了比其他算法更优的效果。

Sep, 2019

一种高效且有效的对抗攻击的 Frank-Wolfe 框架

本文提出一种基于 Frank-Wolfe 算法的新型优化算法框架，可同时用于白盒和黑盒情况下的对抗攻击，并表示该算法具有高效性、有效性和优越的性能。

Nov, 2018

主动学习实现的查询效率高的黑盒攻击

本文探究了 DNN 的黑盒攻击方案，使用现有的白盒攻击方法产生的采样样本进行训练替代模型，并提出主动学习策略和多样性准则以优化其表现，实验证明该方法可以将查询数量减少超过 90% 并保持黑盒攻击成功率。

Sep, 2018

面向查询高效的黑盒攻击：一种无输入视角

本文提出了一种名为 “无需输入” 的攻击方法，用于深度神经网络的对抗攻击，该方法不需要进行大量的查询，可以通过任意图像添加可以感知的扰动来生成对抗性图像。该方法通过灰度图像的初始化和局部扰动与平铺技术来显着降低了查询复杂度，并成功击败了 Clarifai 食品检测 API 和百度动物识别 API。

Sep, 2018