ICMLMar, 2021

图像分类器的稀疏对抗攻击:L1-APGD 注意约束

TL;DR研究了基于 $l_1$ 投影的梯度下降算法,提出一种自适应算法 $l_1$-APGD 用于攻击和对抗训练,通过 $l_1$-AutoAttack 可以可靠地评估 $l_1$-ball 和 $[0,1]^d$ 威胁模型下的对抗容忍度。