ACLMay, 2022

学会忽略对抗攻击

TL;DR使用理性模型可以成功在 BERT 和 RoBERTa 中提高超过 10% 的鲁棒性,显著忽略攻击词并在多个数据集上表现优异