ACLMar, 2021
ReinforceBug:生成对抗文本样本的框架
ReinforceBug: A Framework to Generate Adversarial Textual Examples
Bushra Sabir, M. Ali Babar, Raj Gaire
TL;DR本文提出了一种基于强化学习框架的 ReinforceBug 方法,可以生成保持功能等效性和语义相似性的可转移的 Adversarial Examples ,目标模型平均置信度为错误预测,与 TextFooler 相比,攻击成功率平均提高 10%,在其他模型上具有平均 46%的成功率。