Mar, 2022

重新构建和集成:探索防御文本对抗的方法

TL;DR提出 “Rebuild and Ensemble Framework” 方法用于针对自然语言处理任务中的对抗攻击,通过重新构建机制训练鲁棒性模型,并在推理期间集成已重新构建的文本以实现对抗性防御。实验证明,该方法能够提高在目前强对抗攻击方法下的准确性。