Mar, 2022

一种基于提示的对抗性样本生成和鲁棒性增强方法

TL;DR本研究提出了一种基于 Prompt 的新型对抗攻击和提高自然语言处理模型的鲁棒性的技术,包括恶意 Prompt 构建、对抗样本生成和 Prompt-based 对抗训练方法,并实验验证了攻击成功率的高效性和鲁棒性提高方法的有效性。