ICLROct, 2023

通过非对称负对比和反向注意力实现鲁棒表征学习

TL;DR深度神经网络容易受到对抗性噪声的攻击。为了解决这个问题,我们提出了一种通用的对抗训练框架来获得稳健的特征表达,通过非对称负对比度和反向注意力来推动不同类别的特征在特征空间中远离,并通过线性分类器参数对特征进行加权以获得类别感知的特征并将相同类别的特征相互靠近。经过在三个基准数据集上的实证评估,我们的方法大大提高了对抗训练的鲁棒性并实现了最先进的性能。