ACLMay, 2022

不必担心小事,将其分类:样本屏蔽以保护文本分类器免受对抗性攻击

TL;DR本文提出了一种新颖的文本分类防御策略 Sample Shielding。该方法在不需要重新配置分类器或外部资源的情况下,对三种流行的深度学习文本分类器进行防御攻击,并在三个数据集中测试其鲁棒性。通过样本选择和分类来实现决策,避免了现有防御策略的关键漏洞。