Apr, 2023

抵御语义保护的对抗性攻击的鲁棒深度学习模型

TL;DR本文使用语义保持的敌对攻击机制(SPA 攻击)研究了深度学习模型对联合扰动的鲁棒性,使用属性调节器生成自然可理解的扰动并使用噪声生成器生成不同敌对噪声,并结合此类扰动来生成联合扰动样本以用于深度学习模型的鲁棒性训练。实验结果表明,SPA 攻击会使性能下降,并且优于现有的防御方法。