基于特征空间的对抗攻击

AAAIApr, 2020

Towards Feature Space Adversarial Attack

Qiuling Xu, Guanhong Tao, Siyuan Cheng, Xiangyu Zhang

TL;DR本文提出了一种新的对抗攻击方法，通过扰动表示样式的抽象特征，包括可解释和不可解释的风格，诸如鲜艳色彩和锐利轮廓等，通过优化程序注入难以察觉的风格变化，实现深度神经网络模型误分类，我们展示了该方法产生的对抗样本比现有的非受限制攻击更加自然，并支持现有的像素空间的对抗攻击检测和防御技术难以在风格相关特征空间中保证模型的鲁棒性。

Abstract

We propose a new adversarial attack to deep neural networks for image classification. Different from most existing attacks that directly perturb input pixels, our attack focuses on perturbing abstract features, more specifically, features that denote →

adversarial attacks deep neural networks image classification styles model misclassification

发现论文，激发创造

通过限制深度神经网络的隐藏空间来进行对抗性防御

针对深度神经网络易受对抗性攻击的问题，本文提出了一种基于特征重构的防御方法，具体来说，通过将每个类别的特征强制限制在一个凸多面体内，使得网络学习到的决策区域更加独特和远离各个类别的边界，提高了网络的鲁棒性，同时在干净图像的分类性能上不会退化。

Apr, 2019

在潜空间中产生对抗性攻击

通过使用生成对抗网络在潜在空间中注入对抗性扰动，避免了基于边缘的先验条件并确保了与基于像素的对抗性攻击方法相比视觉上真实的高度，实现了在 MNIST，CIFAR10，Fashion-MNIST，CIFAR100 和 Stanford Dogs 数据集上生成对抗攻击的有效性。

Apr, 2023

风格化对抗防御

利用目标样本的样式和内容信息以及其类边界信息创建对抗性扰动，将其应用于多任务目标并进行深度监督，提取多尺度特征知识以创建最大分离对手，随后提出最大间隔对抗训练方法，最小化源图像与其对手之间的距离，并最大化对手和目标图像之间的距离，证明与最先进的防御相比，我们提出的对抗训练方法表现出强大的鲁棒性，对自然出现的损坏和数据分布变化具有良好的泛化能力，并保留了模型在干净样本上的准确性。

Jul, 2020

图像空间之外的对抗攻击

本文针对深度神经网络生成对抗样本的问题展开了研究，提出了针对 3D 物理性质改变的对抗样本生成方法，并通过在 2D 输入图像前增加可渲染模块的方式，成功地将对抗扰动提升到物理空间，检验了所设计的方法的有效性。

Nov, 2017

基于统计对齐的特征空间目标攻击

通过引入高阶统计量，我们设计了两种新的算法来实现统计导向的对抗样本生成，相比于当前主流的方法，在中等难度下能够取得更好的攻击性能。

May, 2021

通过特征操纵生成语义对抗样本

本文提出了一种实用的针对深度神经网络的对抗攻击方法，通过语义意义感知的结构化扰动来操纵图像的语义属性，以此生成针对黑盒分类器的对抗扰动，并提出了两种无监督的语义操作方法，通过在潜在空间中扰动单个或多个潜在因素，并在真实图像数据上进行大量实验，证明了其能力的强大性，同时也论证了普适于所有图像的语义对抗样本的存在。

Jan, 2020

探索对抗图像的空间

本研究在 MNIST 和 ImageNet 数据集上探究了浅层和深度分类器对抗性图像的像素空间，并证明了在相同任务中与深度卷积神经网络相比，浅层分类器的抗干扰性更强，同时也提供了新的展示现象及其高可变性的可视化。

Oct, 2015

语义对抗攻击：参数转换欺骗深度分类器

本文通过对参数条件生成模型的范围空间进行对抗性损失的优化，提出了一种新颖的方法来生成 “语义” 对抗性示例，并在面部图像上展示了其攻击的效果。

Apr, 2019

深度特征分布的可迁移扰动

该研究提出了一种基于类别和层次深度特征分布建模和利用的新型对抗攻击方法，其可实现针对未受保护的 ImageNet 模型的最先进的有针对性的黑盒转移攻击结果，并且具有攻击过程可解释性和可解释性的优先级。

Apr, 2020

基于频率的语义相似性不可察觉对抗攻击

通过在特征表示上进行对抗攻击，使用语义相似性对分类器进行攻击，同时使用低频率约束，保证对抗样本和原始样本的感官相似性和跨数据集泛化。

Mar, 2022