高效组合优化的简约黑盒对抗攻击
本文提出了一种新的方法,利用自然进化策略在黑盒攻击下生成可靠的对抗样本,并通过新的算法在部分信息下进行有针对性的攻击,无需使用梯度,可以使用少量的请求操作,成功地对商业部署的机器学习系统进行了第一次有针对性的攻击。
Dec, 2017
这篇论文提出了 GenAttack—— 一种基于遗传算法的无梯度黑盒对抗攻击优化技术,在 MNIST、CIFAR-10 和 ImageNet 数据集上成功地生成了对抗性样本,攻击了最新的图像识别模型,且所需的查询量比之前的攻击方法少了几个数量级,且还能攻击一些针对对抗性训练的防御措施,通过实验证明了遗传算法在黑盒攻击研究中的可行性和前景。
May, 2018
提出了一种新的基于梯度估计的黑盒攻击方法,攻击者可以查询目标模型的类概率,无需使用可转移性。该攻击在 MNIST 和 CIFAR-10 数据集上的攻击成功率均超过 100%,同时成功攻击了 Clarifai 的实时图像分类器和最新防御方法。
Dec, 2017
本文提出了一种使用贝叶斯优化方法对黑盒序列数据模型进行查询有效的对抗样本攻击,有效地提高了攻击成功率并且减小了查询次数和修改率。
Jun, 2022
本文提出一种用于攻击离散和非连续的机器学习模型的新方法,将难标记黑盒攻击转化为实值优化问题,并且在 MNIST,CIFAR 和 ImageNet 数据集上展示出比现有方法更优异的表现。
Jul, 2018
本文介绍了一个基于连续数值置信度分数的、高效构建黑盒中敌对图像的简单迭代算法,并且该算法同样适用于有目标和无目标攻击。作者使用少于 20 行的 PyTorch 代码在 Google Cloud Vision API 中展示了该算法的高效和有效性。
May, 2019
本文提出一种基于 Frank-Wolfe 算法的新型优化算法框架,可同时用于白盒和黑盒情况下的对抗攻击,并表示该算法具有高效性、有效性和优越的性能。
Nov, 2018
本文探究了 DNN 的黑盒攻击方案,使用现有的白盒攻击方法产生的采样样本进行训练替代模型,并提出主动学习策略和多样性准则以优化其表现,实验证明该方法可以将查询数量减少超过 90% 并保持黑盒攻击成功率。
Sep, 2018
本文提出了一种名为 “无需输入” 的攻击方法,用于深度神经网络的对抗攻击,该方法不需要进行大量的查询,可以通过任意图像添加可以感知的扰动来生成对抗性图像。该方法通过灰度图像的初始化和局部扰动与平铺技术来显着降低了查询复杂度,并成功击败了 Clarifai 食品检测 API 和百度动物识别 API。
Sep, 2018