EMNLPApr, 2020

基于 BERT 的文本分类对抗样本

TL;DR本研究提出了一种基于 BERT 掩码语言模型的背后攻击方法(BAE),用于生成自然、语义和语法准确的对抗性示例,比目前基于规则的同义词替换策略生成的对抗性示例更具攻击性。