Jun, 2024

DiffuseDef: 对抗攻击下的改进鲁棒性

TL;DR通过结合迁移学习、扰动模型和集成学习技术,我们提出了一种新颖和灵活的文本分类对抗防御方法 DiffuseDef,它在编码器和分类器之间引入扩散层作为去噪器,经过迭代去噪和集成生成鲁棒的文本表示。实验证明,DiffuseDef 在各种对抗性攻击中表现优异,实现了最先进的性能。