Feb, 2024

深度神经网络中反向工程后训练的通用防御机制

TL;DR本文介绍了一种新的检测器,利用被保护深度神经网络的内部特征映射来检测和逆向工程后门,并识别其目标类别;该检测器可以在训练结束后操作,对各种内部化机制都具有高效性,且计算开销较低,可实现可扩展性。