Jul, 2023

生成可传递对抗样本的常识学习

TL;DR本文研究黑盒攻击的一种重要类型 —— 基于转移的对抗攻击,并提出了一种通用知识学习框架,通过构建多教师框架来减少模型特定特征,获得更好的输出分布,加强对抗转移性能,同时通过对学生和教师模型之间的梯度施加约束来进一步缓解输出不一致问题和增强对抗转移性能。实验表明,所提出的方法可以显著提高对抗转移性能。