ACLApr, 2021

度量指导的对抗式句子生成

TL;DR本文提出了一个 rewrite and rollback(R&R)框架,该框架通过优化批判分数来改进对抗样例的质量,结合流畅度、相似性和错分类度量,提高了对抗样例的质量,并在 5 个代表性数据集和 3 种分类器架构上进行了评估,攻击成功率分别增加了 + 16.2%,+12.8%和 + 14.0%。