May, 2023

攻守之道:对抗性攻击增强对抗性增强

TL;DR本研究提出了一种名为 $A^5$ 的新框架,包括针对对抗攻击的首个认证预防性防御方法,该方法的主要思想是利用现有的神经网络自动扰动分析工具来为输入数据创建一种防御性扰动,从而保证在一定幅度攻击下输入数据的防御性失败。 在多项测试中,$A^5$ 打败了当前最先进的 MNIST,CIFAR10,FashionMNIST 和 Tinyimagenet 认证防御技术,并且还展示了如何使用 $A^5$ 创建可证明鲁棒的物理对象。