Jun, 2024

分布对抗损失

TL;DR对抗攻击的一个主要挑战是可能的攻击方法的庞大空间,本研究引入了一种称为分布对抗损失的新概念,旨在统一随机平滑和输入离散化两种有效削弱攻击者影响的方法。我们证明我们的概念具有 VC 维度和每个输入关联的允许对抗分布集合的大小方面的泛化保证,并通过实验证实该过程,改进了模型对各种对抗攻击的鲁棒性。