ICLRJan, 2022

用于二分类和多攻击场景的后训练后门攻击检测

TL;DR本文提出了一种基于反向工程和期望可转移性统计量的检测框架,旨在解决在无法访问分类器的训练集和其他清洁参考分类器的情况下检测深度神经网络分类器遭受后门攻击的问题,该框架能够在多个数据集上取得非常优异的表现,且适用于具有多个攻击的多类情况。