对成功的对抗样本的鲁棒性界限：理论与实践

Mar, 2024

对成功的对抗样本的鲁棒性界限：理论与实践

Robustness Bounds on the Successful Adversarial Examples: Theory and Practice

Hiroaki Maeshima, Akira Otsuka

TL;DR该研究选择了对抗样本（AE）作为机器学习的一种攻击方法，通过对数据添加不可感知的扰动来诱导错分。研究通过使用高斯过程（GP）分类，探究了成功 AE 的概率上限，并证明了该上限取决于 AE 的扰动范数、GP 中使用的核函数以及训练数据集中不同标签最近对之间的距离。令人惊讶的是，该上限并不依赖于样本数据集的分布情况。通过在 ImageNet 上进行的实验证明了我们的理论结果，并展示了改变核函数参数会导致成功 AE 概率上限的变化。

Abstract

adversarial example (AE) is an attack method for machine learning, which is crafted by adding imperceptible perturbation to the data inducing misclassification. In the current paper, we investigated the upper bou

adversarial example machine learning gaussian process perturbation norm kernel function

发现论文，激发创造

深度神经网络模型的对抗样本检测：回顾与实验比较

本文主要研究了针对神经网络分类器的测试时间攻击检测方法，并在不同数据集和场景下提供了八种最先进的检测器的实验结果，为此研究方向提供了挑战和未来的展望。

May, 2021

对抗样本游戏

本文提出 Adversarial Example Games (AEG)，一种基于 min-max 博弈的生成对抗样本方法，实现了在给定假设类别的基础上训练生成器和分类器，证明了该方法能生成可攻击对应假设类别中所有分类器的对抗样本，实验表明该方法在 MNIST 和 CIFAR-10 数据集上相对于其他方法有了明显的提升。

Jul, 2020

对好事者的对抗样本：对抗样本引导下的不平衡学习

本文研究了对抗样本在不平衡学习中的应用，在训练中引入 Guiding Adversarial Examples (GAEs) 方法，通过调整有偏的决策边界，将该方法应用在少数派类别样本的分类任务中，证明其能有效提高少数派类别样本的准确率，而对大多数派样本的准确率影响较小，该方法可与现有最先进方法媲美。据我们所知，我们是第一个应用对抗样本处理不平衡学习问题的研究。

Jan, 2022

高斯过程分类的对抗性漏洞边界

本文提出了一种防止黑客攻击，保护机器学习分类器免受对抗性样本的影响的方法，通过一个对抗边界来限制潜在的对抗攻击产生误分类的能力并测试了其效果。

Sep, 2019

GNP 攻击：通过梯度范数惩罚产生可迁移的对抗样本

通过梯度范数惩罚的新方法大大提高了对抗样本的可传递性，使其能够在各种目标模型上进行黑盒攻击，对源模型的体系结构和特征表示的拟合度较低，同时也能与其他基于梯度的方法进行整合以实现更强的基于传递的攻击。

Jul, 2023

深度神经网络的图像边界上的不可察觉对抗攻击

通过系统性攻击图像边界提出的一种不可察觉的对抗性攻击方法，有效攻击了六个 CNN 模型和 Vision Transformers，仅使用图像边界的 32% 作为输入，成功率达到 95.2%，峰值信噪比为 41.37 dB，借此可以更深入地理解对抗性样本，并给出了构造对抗性样本的不同视角。

Aug, 2023

使用生成模型构建不受限制的对抗样本

本文提出了一种新的威胁模型，即无限制敌对样本。通过条件生成模型，利用辅助分类生成对抗网络（AC-GAN）对数据进行分类，搜索潜空间并生成可能是该类别的在传统敌对攻击中被误分类的图像，证明它们确实属于该类别，并表明无限制敌对样本可以绕过传统的敌对训练和认证的攻击防御方法。

May, 2018

对抗样本的几何性质

该研究提出了一种基于几何框架和流形重建方法的方法，以分析对抗样本的高维几何形状，并证明了不同规范的鲁棒性、球形对抗性训练的样本编号和最近邻分类器与基于球面的对抗训练的充分采样条件。

Nov, 2018

通过集成方法实现可转移音频对抗攻击

本研究旨在探究对深度学习语音识别中对抗性样本传递性的影响因素，发现图像与语音识别中对抗性样本传递性的巨大差异，并提出了基于随机梯度集成和动态梯度加权集成的两种新方法，获得了有效的传递性。

Apr, 2023

集成对抗训练：攻击和防御

该研究论文探讨了对抗性样本及训练，以及如何生成更强的对抗性样本以提高鲁棒性，介绍了集成对抗性训练技术，并表明在 ImageNet 数据集上应用该技术可以显著提高模型的鲁棒性。

May, 2017