ACLMar, 2022
区分自然和非自然对抗样本以获得更强大的预训练语言模型
Distinguishing Non-natural from Natural Adversarial Samples for More Robust Pre-trained Language Model
Jiayi Wang, Rongzhou Bao, Zhuosheng Zhang, Hai Zhao
TL;DR本文通过提出一种异常检测器来评估预训练语言模型的鲁棒性,发现现有的对鲁棒性的评估方法是基于并不常见的对抗样本,进而将该方法用于数据增强和防御方案,取得了比其他方法更高的准确率。