ScaleCert：具有稀疏浅层的可扩展认证抵御对抗性补丁

Oct, 2021

ScaleCert：具有稀疏浅层的可扩展认证抵御对抗性补丁

ScaleCert: Scalable Certified Defense against Adversarial Patches with Sparse Superficial Layers

Husheng Han, Kaidi Xu, Xing Hu, Xiaobing Chen, Ling Liang...

TL;DR提出在高分辨率图像上实现高可证明鲁棒性的认证防御方法，减少敌对区域的搜索开销和过滤预测噪声，从而通过利用重要神经元的本地化性质增强了认证准确性。

Abstract

adversarial patch attacks that craft the pixels in a confined region of the input images show their powerful attack effectiveness in physical environments even with noises or deformations. Existing certified defenses

adversarial patch attacks certified defenses high-resolution images neurons dnn compression

发现论文，激发创造

(去) 随机化平滑处理：针对补丁攻击的可证明防御

本研究介绍了一种针对图像贴片对抗攻击的可证明防御方法，并通过对以往方法的比较，证明了该方法在 CIFAR-10 和 ImageNet 上能有效提高防御水平，是当前领先的防御方法之一。

Feb, 2020

针对图像分类器补丁攻击的高效认证防御

本文提出了 BagCert 架构和认证程序，通过一种新的损失函数实现认证不同大小和位置的对抗破坏，并在 CIFAR10 数据集上取得了对 5x5 对抗破坏下 86% 的准确率和 60% 的认证准确率。

Feb, 2021

基于 Vision Transformer 的实用可验证补丁防御

利用 Vision Transformer 结合 Derandomized Smoothing 进行逐步平滑的图像建模任务来训练并提高证明补丁防御机制的可证准确性，同时重构了原始的 ViT 的全局自注意结构以适用于在实际世界中的高效推理和部署。在 ImageNet 数据集上，在 2% 区域补丁攻击下，本文方法达到 41.70% 的证明准确度，比之前最佳方法高出近 1 倍（26.00%）。同时，本方法达到了 78.58% 的干净准确度，接近正常 ResNet-101 的准确度，并在 CIFAR-10 和 ImageNet 上实现最先进的干净和证明准确度。

Mar, 2022

对抗性贴片的认证防御

本文介绍了对抗补丁攻击的认证和经验性防御措施，其中首次提出了认证防御措施，并实验了不同补丁形状的测试，获得了出人意料的良好的鲁棒性转移。

Mar, 2020

PatchCleanser：针对任何图像分类器的对抗性贴片确保鲁棒性防御

PatchCleanser 是一种用于抵御基于物理世界中对受害对象打印和附加补丁的对抗性攻击的、在图片上执行的像素遮蔽的、适用于各种先进的图片分类器以实现高精度的、具有认证稳健性的防御方法。此方法可以证明在某些图像上永远预测正确的类别标签，同时较之前的工作显着提高了认证稳健性。

Aug, 2021

揭示异常：保护图像分类免受对抗性贴纸攻击

我们提出了一种防御机制，利用聚类技术 DBSCAN 来分离异常图像片段，并通过三阶段流程对敌对噪声进行定位和减轻，进而中和其效果。该防御机制在多个模型和数据集上验证，证明其在对抗性贴片攻击中的有效性，显著提高了准确性。

Feb, 2024

提高目标检测和分类 AI 模型对抗性贴纸攻击的鲁棒性

我们分析了攻击技术并提出了一种强大的防御方法，通过利用对象的形状、纹理和位置，成功降低了 20% 以上的模型置信度。利用修复预处理技术，有效地恢复了原始的置信水平，展示了强大防御在减轻这些威胁中的重要性。我们的修复防御方法在仿真像素化的基于补丁的物理对抗攻击中显著提高了模型的韧性，实现了高精度和可靠的定位，尽管受到了对抗性攻击。这项工作推动了对抗挑战中对象检测和分类网络的韧性和可靠性的发展，并为关键应用提供了强大的基础。

Mar, 2024

少数派报告防御：对抗性贴片防御

本文提出了一种基于部分遮挡图像的防御方法，可在 CIFAR-10、Fashion MNIST 和 MNIST 数据集上提供对一定大小区块攻击的安全保障。

Apr, 2020

针对优化位置的对抗性贴片的对抗训练

提出了一种可通过物理方式应用于图像中的明显但具有对抗性的矩形贴片，并利用对抗训练的方式来增强深度神经网络对对抗贴片的鲁棒性，这种训练不会降低网络的分类准确率。

May, 2020

架构无关的迭代式黑盒认证对抗性贴片防御

本文介绍了针对图像分类器的对抗性贴片攻击的问题，并提出一种名为 IBCD 的两阶段迭代黑盒认证防御方法，旨在提高构架无关的认证防御在黑盒攻击情境下的可行性并检验其有效性和效率。

May, 2023