COLINGMar, 2024

子空间防御:通过学习纯净信号的子空间来排除对抗性扰动

TL;DR通过谱分析来检查样本特征的子空间,我们首先从实证角度表明干净信号或对抗扰动的特征分别是冗余的,而且在低维线性子空间中重叠较少,并且经典的低维子空间投影可以将扰动特征压缩到干净信号的子空间之外,从而使得深度神经网络可以学习一个只包含干净信号特征的子空间,抛弃扰动特征,从而能够区分对抗性样本。为了防止子空间学习中不可避免的残余扰动,我们提出一种独立性准则来区分干净信号和扰动。实验结果表明,所提出的策略能够本质上抑制对抗者,不仅提高了模型的鲁棒性,而且还给出了有效对抗防御的新方向。