Aug, 2023

XGBD: 说明引导的图形后门检测

TL;DR我们提出了一种基于解释的后门检测方法,利用拓扑信息来检测后门样本,通过训练一个辅助模型,将图样本输入模型,并采用解释方法将模型预测归因于一个重要的子图,通过观察到后门样本和干净样本的不同归因分布,解释子图可以作为更具有辨别性的特征来检测后门样本,全面的实验验证了我们方法的有效性和可解释性。