EMNLPJan, 2022

TextHacker: 基于学习的混合局部搜索算法用于文本硬标签对抗攻击

TL;DR该研究提出了一种基于单独预测标签的敌对攻击 TextHacker,通过学习词汇替换对文本输出标签的影响来确定关键词汇,采用混合本地搜索和攻击历史估计词汇重要性来最小化被攻击文本所需的修改,该攻击在文本分类和文本蕴含方面具有显著的优越性。