Aug, 2023

BaDExpert:提取后门功能以准确检测后门输入

TL;DR我们提出了一种针对深度神经网络 (DNNs) 的后期开发防御新方法,用于对抗恶意背后进攻,该方法通过一种新颖的反向工程方法,可以直接从给定的感染模型中提取出背后功能,并将其重建成仅能识别背后输入的模型。我们称之为背后专家模型。我们的防御方法在多个数据集和模型架构上经过验证,有效地减轻了 16 种最先进的背后进攻。