ACLMar, 2021

ReinforceBug:生成对抗文本样本的框架

TL;DR本文提出了一种基于强化学习框架的 ReinforceBug 方法,可以生成保持功能等效性和语义相似性的可转移的 Adversarial Examples ,目标模型平均置信度为错误预测,与 TextFooler 相比,攻击成功率平均提高 10%,在其他模型上具有平均 46%的成功率。