Mar, 2017

黑盒学习系统中对抗样本的阻断可迁移性

TL;DR本文提出了一种训练方法来防止黑盒学习系统受到对抗性示例的攻击,该方法通过在输出类集中增加一个 NULL 标签并训练分类器将对抗性示例分类为 NULL 来阻止其可转让性。实验表明该方法能够有效抵御对抗性示例的攻击,同时在干净数据上保持准确度。