May, 2018

贪婪攻击和Gumbel攻击: 生成针对离散数据的对抗样本

TL;DR本研究提出了一种概率框架,用于研究针对离散数据的对抗攻击,并基于此框架导出了基于扰动的Greedy Attack和可扩展的基于学习的Gumbel Attack方法,探讨了对抗攻击设计中的各种权衡,最终通过对文本分类模型进行实验验证这些方法的有效性,如使用Greedy Attack在仅修改五个字符的情况下,字符卷积神经网络的准确性降至与随机选择相同的水平。