Apr, 2024

攻击基准:对于对抗性样本的基于梯度的攻击评估

TL;DR我们提出了 AttackBench 作为第一个用于评估对抗样本优化的攻击的公平比较框架,通过分类梯度攻击、定义优化度量标准和限制查询次数等方式评估攻击的效果和效率,并通过对超过 100 种攻击实现在 CIFAR-10 和 ImageNet 模型上的 800 多种不同配置的实证分析,发现只有很少的攻击能够超越所有其他竞争方法,同时揭示了阻碍许多攻击找到更好解决方案或运行的几个实现问题,我们将 AttackBench 作为一个公开可用的基准,并致力于不断更新以包含和评估新的梯度攻击方法。