CVPRMar, 2024

缓和以防御:通过自引导标签完善实现对抗鲁棒性

TL;DR鲁棒训练是为了提高深度神经网络对抗攻击的鲁棒性的最有效方法之一,但大多数鲁棒训练方法存在鲁棒过拟合的问题。本文从梯度范数角度首次找到了鲁棒过拟合与噪声标签过渡记忆之间的联系,并提出了一种自我导向的标签优化方法,它能提高标准准确度和鲁棒性,在多个数据集、攻击类型和架构上都得到了验证。此外,从信息理论的角度对我们的方法进行了分析,并指出了软标签对于鲁棒泛化的重要性。