May, 2024

对抗鲁棒性表示学习的光谱正则化

TL;DR我们提出了一种新的谱正则化方法,该方法鼓励下游分类任务中特征表示的黑盒敌对鲁棒性,实证结果表明,该方法在提高测试准确性和鲁棒性方面比以前提出的方法更加有效,并且改善了利用自监督训练或从其他分类任务中传递学习到的表示学习分类器的敌对鲁棒性。总体而言,我们的工作开始揭示表示结构如何影响敌对鲁棒性。