ICMLMay, 2023

带有拒绝机制的分层对抗鲁棒性

TL;DR针对分类器的对抗训练模型中的拒绝选项,根据拒绝代价模型,提出了一种新的防御方法 —— 基于一致性预测的拒绝的对抗训练模型,实验证明在强适应性攻击中具有明显的性能优势。