ACLMar, 2021

芝麻街上的混合语言:对抗性多语种者的黎明

TL;DR本文介绍两种针对多语言模型的黑盒对抗攻击和一种高效的对抗性训练方案,以提高多语言模型处理混合语言的表现。短语级攻击的成功率为 89.75%,将 XLM-R-large 的平均准确性从 79.85 降至 8.18。