Aug, 2023

通过对抗性输出日志更新推进对抗鲁棒性

TL;DR在这项研究中,从理论的角度分析了成功的对抗攻击周围的逻辑差异,并提出了一种新的原则,即Adversarial Logit Update (ALU),用于推断对抗样本的标签。基于ALU,引入了一种新的分类范式,利用预净化和后净化的逻辑差异来提高模型的对抗鲁棒性。经过广泛实验证明,所提出的解决方案在CIFAR-10、CIFAR-100和tiny-ImageNet数据集上相对于最先进的方法具有卓越的鲁棒性能。