Jan, 2024

通过学习限制性对敌多面体提高对抗攻击鲁棒性

TL;DR通过限制对干净样本添加范数约束的微小扰动后得到的输出可达集合,我们旨在训练出对抗攻击具有强鲁棒性的深度神经网络。我们称这个集合为对抗多面体,每个干净样本都对应一个对抗多面体。实际上,如果所有样本对应的多面体都是紧凑的,并且不与深度神经网络的决策边界相交,那么深度神经网络就能对抗攻击具有鲁棒性。因此,我们的算法的内部工作是基于学习受限的对抗多面体(CAP)。通过一系列实验证明了 CAP 相对于现有的对抗鲁棒性方法在提升模型对抗最先进攻击(包括 AutoAttack)的鲁棒性方面的有效性。