贪婪攻击和Gumbel攻击: 生成针对离散数据的对抗样本

May, 2018

贪婪攻击和Gumbel攻击: 生成针对离散数据的对抗样本

Greedy Attack and Gumbel Attack: Generating Adversarial Examples for Discrete Data

Puyudi Yang, Jianbo Chen, Cho-Jui Hsieh, Jane-Ling Wang, Michael I. Jordan

TL;DR本研究提出了一种概率框架，用于研究针对离散数据的对抗攻击，并基于此框架导出了基于扰动的Greedy Attack和可扩展的基于学习的Gumbel Attack方法，探讨了对抗攻击设计中的各种权衡，最终通过对文本分类模型进行实验验证这些方法的有效性，如使用Greedy Attack在仅修改五个字符的情况下，字符卷积神经网络的准确性降至与随机选择相同的水平。

Abstract

We present a probabilistic framework for studying adversarial attacks on discrete data. Based on this framework, we derive a perturbation-based method, →