May, 2021

通过随机 [MASK] 实现对文本对抗攻击的认证鲁棒性

TL;DR本文提出了一种随机遮挡的可证明鲁棒防御方法,对于 AGNEWS 数据集上五个词,SST2 数据集上两个词的任意扰动分类可以获得超过 50% 的证明鲁棒性,并在多个数据集上明显优于最近提出的防御方法。