Dec, 2023

图像分类模型的对抗攻击:分析与防御

TL;DR本文介绍了对基于卷积神经网络(CNN)的图像分类模型进行对抗攻击的概念,并探讨了一种被称为 FGSM(快速梯度符号方法)的著名对抗攻击方法对图像分类模型性能的负面影响。对三种预训练图像分类器 CNN 结构(ResNet-101,AlexNet 和 RegNetY 400MF)使用 ImageNet 数据集中的随机选择图像进行了模拟 FGSM 攻击,并计算了在攻击存在与不存在时分类器的准确性,以展示攻击对模型性能的有害影响。最后,提出了一种基于修改的防御蒸馏方法来防御 FGSM 攻击,并给出了详尽的实验结果用于验证所提出方案。