Apr, 2024

增强守护者而非宝藏:适应性对抗性检测器

TL;DR针对自适应攻击提出了一种名为 RADAR-Robust Adversarial Detection via Adversarial Retraining 的方法,旨在增强对抗性检测器的鲁棒性,同时保持分类器的性能。在训练阶段,我们将优化后的对抗性样本集成到数据集中,使对抗性检测器能够学习和适应潜在的攻击场景,从而显著提高检测器准确识别自适应对抗性攻击的能力,而不会损害净准确性。