Apr, 2024

LSP框架:基于标签平滑攻击的触发器逆向工程的补偿模型

TL;DR深度神经网络容易受到后门攻击,本文提出了一种基于触发器逆向工程的防御方法,通过操纵后门样本的分类置信度来抵御触发器逆向工程,引入标签平滑引入(LSP)框架来实现分类置信度的特定操纵,实验证明该方法可以击败当前的触发器逆向工程方法,并与各种后门攻击具有良好的兼容性。