Mar, 2018

通过神经指纹识别对抗性样本

TL;DR该论文提出了一种名为神经指纹的简单而有效的方法,通过验证模型行为是否与一组秘密指纹一致的方法检测对抗性例子,具有检测速度快、攻击者极难逆向工程以及不需要假定对手知识等优势。该方法在各种威胁模型下均表现优异,成功检测出了具有最强攻击性的对抗样本,同时还能很好地适应各种超参数和指纹选择。