Oct, 2023

通过特征偏移调整实现稳定的后门净化

TL;DR深度神经网络容易受到后门攻击,传统的防御方法存在各种问题。本研究提出了一种基于特征位移调整的后门净化方法,通过调整分类器权重来使得后门特征与正常特征分离,实验结果表明该方法在多种攻击场景下表现稳定,并且具有较低的计算成本。