May, 2024

通过扰动伪造检测对抗性数据

TL;DR通过学习区分自然数据分布与对抗性噪声分布的覆盖关系,我们提出了扰动伪造方法,通过噪声分布扰动、稀疏掩模生成和伪对抗性数据生成来训练一个对所有类型的对抗性攻击具有强大泛化能力的检测器,同时不依赖任何特定模型。实验证明我们的方法具有出色的泛化能力。