Sep, 2019

使用深度强化模型为文本分类器生成黑盒对抗样本

TL;DR提出了一种基于强化学习的方法,在黑盒设置中生成对抗性示例,能够成功地欺骗针对IMDB情感分类任务和AG新闻语料库新闻分类任务的模型,并且生成的对抗示例保留了原始文本的语义。