图像分类模型的对抗攻击：分析与防御

Dec, 2023

图像分类模型的对抗攻击：分析与防御

Adversarial Attacks on Image Classification Models: Analysis and Defense

Jaydip Sen, Abhiraj Sen, Ananda Chatterjee

TL;DR本文介绍了对基于卷积神经网络（CNN）的图像分类模型进行对抗攻击的概念，并探讨了一种被称为 FGSM（快速梯度符号方法）的著名对抗攻击方法对图像分类模型性能的负面影响。对三种预训练图像分类器 CNN 结构（ResNet-101，AlexNet 和 RegNetY 400MF）使用 ImageNet 数据集中的随机选择图像进行了模拟 FGSM 攻击，并计算了在攻击存在与不存在时分类器的准确性，以展示攻击对模型性能的有害影响。最后，提出了一种基于修改的防御蒸馏方法来防御 FGSM 攻击，并给出了详尽的实验结果用于验证所提出方案。

Abstract

The notion of adversarial attacks on image classification models based on convolutional neural networks (CNN) is introduced in this work.

adversarial attacks convolutional neural networks fast gradient sign method image classification defensive distillation-based approach

发现论文，激发创造

图像分类模型的对抗性攻击：FGSM 和 Patch 攻击及其影响

本文介绍了对卷积神经网络 (CNN) 图像分类模型进行对抗攻击的概念，并对两种广为人知的对抗攻击 —— 快速梯度符号方法 (FGSM) 和对抗性贴片攻击进行了讨论和分析，分别在 ResNet-34、GoogleNet 和 DenseNet-161 三种预先训练的强大图像分类器体系结构上启动这两种攻击，并在公开可访问的 ImageNet 数据集上计算模型在有无攻击的情况下的分类精度，分析了攻击对图像分类任务的影响。

Jul, 2023

消除对抗攻击在计算机网络间的传递能力整理

我们提出了一种新颖和全面的方法，以提高对卷积神经网络（CNNs）中对抗性示例的攻击强度和传递性的评估，以及验证计算机网络应用中是否存在传递性问题。我们的研究结果表明，即使在计算机网络应用中，对抗性示例对安全的威胁需要开发新的防御机制来增强深度学习技术的安全性。

Oct, 2023

一种基于卷积神经网络的相机模型识别反取证方法

本文研究了通过对抗性的样本对基于卷积神经网络的相机模型检测器进行欺骗的反取证方法，并展示了即使用针对图像分析和获取相机模型信息的先进深度学习架构，也存在一定漏洞。

May, 2018

医学图像分割模型对对抗攻击的敏感性

医学影像分割模型容易受到对抗性攻击，参数大小与对抗性攻击成功率之间没有明显的相关性，并使用不同于训练所用的损失函数可提高对抗性攻击的成功率。

Jan, 2024

人脸识别领域中卷积神经网络的对抗性攻击

本文以 Fast Gradient Sign Method 为基础，对面部图像数据集进行扰动，测试不同黑盒攻击算法的鲁棒性，并重点研究修改单个最佳像素或所有像素的攻击方法。研究结果表明，所有像素攻击方法能使分类器置信度平均下降至 84％，且 81.6％的误分类率，但这些图像始终可以被人类识别。该研究可为防御性对抗攻击、自适应噪声降低技术等方面的 DNNs 训练和研究提供宝贵的参考。

Jan, 2020

评估对抗稳健性：FGSM、Carlini-Wagner 攻击的比较及蒸馏在防御机制中的作用

这篇学术论文深入探讨了针对图像分类任务中使用的深度神经网络（DNN）的对抗性攻击，并调查了旨在增强机器学习模型鲁棒性的防御机制。研究聚焦于理解两种主要攻击方法的影响：快速梯度符号法（FGSM）和 Carlini-Wagner（CW）方法。该文献提出防御蒸馏作为一种抵御 FGSM 和 CW 攻击的防御机制，并使用 CIFAR-10 数据集对其进行评估。虽然该提出的防御技术在抵御 FGSM 等攻击方面表现出有效性，但依然易受到更复杂的技术，如 CW 攻击的影响。通过严格的实验和分析，该研究为对 DNNs 的对抗性攻击的动态以及防御策略的有效性提供了深入见解。

Apr, 2024

皮肤癌分类的对抗攻击与防御

该论文研究了针对皮肤镜像中皮肤边缘检测分类的卷积神经网络的敌对攻击技术，以及对抗训练的防御技术对其鲁棒性提升的效果。

Dec, 2022

Defense-GAN: 使用生成模型保护分类器免受对抗攻击

Defense-GAN 使用生成模型来抵御深度神经网络受到的对抗性攻击，并不需要修改分类器结构或者训练过程，可以适用于任何分类模型，并且不需要了解生成对抗性示例的过程。在不同的攻击方法下，实验证明 Defense-GAN 对抗性攻击防御策略具有一致的有效性，并可以提高现有的防御策略。

May, 2018

图像网中鲁棒高效的干扰神经网络防御对抗攻击

对抗性图像的存在严重影响了图像识别任务和深度学习的实际应用，本文构造了一种干扰神经网络，通过使用额外的背景图像和相应的标签以及预先训练的 ResNet-152，在较小的计算资源下实现了比 PGD 攻击下现有最先进结果更好的防御效果，为有效抵御对抗性攻击的学术研究和实际应用提供了新的思路。

Sep, 2023

快速优于免费：再探对抗训练

通过使用快速梯度符号方法（FGSM）来作为对抗样本的构造方法，使得对抗训练的代价不比标准训练更高，而且 FGSM 对抗训练与 PGD 对抗训练效果相当。最后，我们还研究了 FGSM 对抗训练的 “灾难性过拟合” 失败模式。

Jan, 2020