Dec, 2023

OCGEC: 基于图嵌入的一类分类方法用于深度神经网络后门检测

TL;DR本研究提出了一种称为 OCGEC 的新型单一类别分类框架,使用少量的清洁数据和基于图神经网络(GNNs)的模型级后门检测来检测后门攻击。与其他基线相比,在许多任务上,我们的 OCGEC 方法实现了超过 98%的 AUC 分数,大大超过现有的方法,并且无需依赖大量的正样本和负样本。我们对图形场景的创新应用为泛用后门检测提供了新的见解,可用于改进其他后门防御任务。