元对抗训练对抗万能贴

ICMLJan, 2021

Meta Adversarial Training against Universal Patches

Jan Hendrik Metzen, Nicole Finnie, Robin Hutmacher

TL;DR使用 meta adversarial training (MAT) 针对基于图像的反攻击 (adversarial attacks) 进行训练，该模型能够显著提高模型对于通用补丁 (universal patch) 的鲁棒性，并且在图像分类和交通信号灯检测方面具有广泛的应用。

Abstract

Recently demonstrated physical-world adversarial attacks have exposed vulnerabilities in perception systems that pose severe risks for safety-critical applications such as →

adversarial attacks perception systems autonomous driving adversarial training meta adversarial training

发现论文，激发创造

针对优化位置的对抗性贴片的对抗训练

提出了一种可通过物理方式应用于图像中的明显但具有对抗性的矩形贴片，并利用对抗训练的方式来增强深度神经网络对对抗贴片的鲁棒性，这种训练不会降低网络的分类准确率。

May, 2020

SlowFormer：面向计算与能量效率的通用敌对修补攻击 —— 对推理高效视觉转换器的攻击

近期，在深度模型的推断计算方面取得了很多进展，这些方法可以减少深度模型的计算需求和功耗。我们展示了这些模型容易受到普适性对抗贴片攻击的影响，攻击者通过优化一个贴片，将其粘贴到任意图像上可以增加模型的计算量和功耗。我们运行实验使用了三种不同的高效视觉转换器方法，显示在某些情况下，攻击者只需将一个只占图像面积的 8% 的贴片粘贴上即可将计算量增加到最大限度。同时我们还展示了标准对抗性训练防御方法可以减少攻击的成功率。我们相信为降低深度模型的功耗，未来需要采用自适应高效的方法，希望我们的论文可以鼓励研究人员研究这些方法的强韧性，并开发更好的防御方法来对抗这种攻击。

Oct, 2023

对抗性贴片

提出了一种在现实世界中创建通用、强健和有目标的对抗图像贴片的方法，这些贴片可以被添加到场景中以攻击任何情况的图像分类器。

Dec, 2017

基于偏差的通用对抗性标志攻击用于自动结账

使用感知偏差和语义偏差相结合的偏差架构来生成具有强大泛化能力和普遍性的对抗性补丁，提高攻击的效率和性能。

May, 2020

TPatch: 一种触发的物理对抗性补丁

提出了一种由声音信号触发的物理对抗性贴片 TPatch，其具有声物质注入攻击引入的设计失真，可以在正常情况下保持良性，但可以通过触发来启动隐藏、创造或改变攻击。通过基于内容的伪装方法和攻击韧性增强方法，我们提出了避免引起人类驾驶员怀疑并使攻击在真实世界中实用和强韧的方法。使用三种对象检测器（YOLO V3/V5 和 Faster R-CNN）和八种图像分类器对 TPatch 进行评估，这既在模拟环境中也在真实世界中表明了 TPatch 的有效性。我们还讨论了传感器、算法和系统级别的可能防御方法。

Dec, 2023

通用对抗训练

本文研究的是生成通用对抗扰动和抵御这类扰动的有效方法，提出了一种简单的基于优化的通用攻击方法来降低各种网络的 ImageNet 上的准确性，并提出了一种通用对抗性训练来生成抗干扰的分类器。

Nov, 2018

飞行对抗性贴片：操纵基于深度学习自主多旋翼的行为

通过将图像装载到另一个飞行机器人上，将对多旋翼机器人进行全面控制的飞行对抗性补丁放置在其视野中，对自主飞行机器人进行深度学习模型攻击的研究。

May, 2023

物理世界中跨模态攻击的统一对抗贴片

本文提出了一种跨模态物理攻击方法，在物理世界中通过统一的对抗性贴片欺骗可见光和红外物体探测器，在考虑到不同成像机制的情况下，通过设计新型的边界受限形状优化和考虑得分的迭代评估，成功地减少了多模式传感器的预测得分。

Jul, 2023

自主驾驶实时语义分割模型的现实世界的对抗鲁棒性

该研究评估并提出改进方法，以提高当受到数字、模拟和实际的对抗性补丁攻击时，对语义分割模型的稳健性。研究结果表明，尽管对抗效果在数字和真实攻击中可见，但其影响通常局限于图像周围的补丁区域，这就打开了进一步探讨实时语义分割模型的空间鲁棒性的问题。

Jan, 2022

欺骗自动监控摄像机：对抗性贴片攻击人员检测

本文介绍了一种针对具有高度内类变异的待攻击目标，即人体，生成对抗贴片的方法，并且通过实验表明，我们的系统能显著降低人体检测器的准确性，同时还在实际场景中能够进行攻击。

Apr, 2019