May, 2024

HOLMES:使用多个检测器检测对抗样本

TL;DR通过监测深度神经网络(DNNs)的输出(logits),我们提出了 HOLMES(Hierarchically Organized Light-weight Multiple dEtector System),用于检测潜在的对抗性示例,以加强 DNNs 并最小化其对实际环境的威胁。HOLMES 能够高精度地区分来自多种攻击方式产生的未知对抗性示例,并且相较于单一检测系统具有较低的误报率,在适应性模型中表现出色。