ICMLApr, 2023

通过中间层干扰衰减来提高对抗性可迁移性

TL;DR论文提出了一种名为 ILPD 的新方法,通过单一阶段的优化过程,鼓励中间层扰动同时具有有效的对抗方向和巨大的幅度,以构建对抗性样本。实验结果表明,该方法在攻击各种受害者模型方面的性能大大优于现有技术,其中在 ImageNet 上平均提高了 10.07%,在 CIFAR-10 上平均提高了 3.88%。