Oct, 2022

预训练对抗扰动

TL;DR本文提出了一种用于生成预训练模型对抗攻击的通用扰动 Pre-trained Adversarial Perturbations (PAPs) 方法,其中采用低级层提升攻击 (Low-Level Layer Lifting Attack, L4A) 的方法来生成扰动,并结合增强的噪声增广策略生成更具可传递性的 PAPs,实验证明我们的方法比现有方法在攻击成功率方面有了大幅度提高。