Nov, 2021

对抗 GLUE:一个用于评估语言模型鲁棒性的多任务基准

TL;DR本文提出 Adversarial GLUE(AdvGLUE)—— 一个新的多任务基准,系统地将 14 种文本对抗攻击方法应用于 GLUE 任务,进一步通过人工验证实现可靠注释,揭示了现代大规模语言模型面对各种类型对抗攻击漏洞的严重性,呼吁对更具隐蔽性和语义保持性的新型对抗攻击和新型强鲁棒性语言模型的发展。