Jun, 2024

MaskPure: 基于随机纯净化的文本对抗防御的改进

TL;DR通过扩展受扩散过程启发的输入文本纯化方法,我们提出了一种名为 MaskPure 的新方法,无需对抗分类器进行训练且不需要攻击类型知识,它在同类防御方法中显示出卓越的稳健性和可靠性,同时证明了它的可证实稳健性。