ICCVNov, 2020

可学习的边界引导对抗训练

TL;DR本研究通过引入已训练的干净模型的分类边界来指导对抗训练,约束对抗性模型的 logits 与自然数据下的干净模型的 logits 相似,从而提高了模型的鲁棒性和自然数据的准确性。实验证明,该方法在 CIFAR-10、CIFAR-100 和 Tiny ImageNet 上具有新的最先进的鲁棒性,无需额外的真实或合成数据。