ACLMay, 2020

关于语言编码器对语法错误的鲁棒性

TL;DR本文旨在研究预训练语言编码器(ELMo,BERT 和 RoBERTa)在面对自然语法错误时的表现,通过采集真实语法错误和进行对抗性攻击来模拟这些错误对干净文本数据的影响。结果证实,所有测试模型的性能都受到了影响,但影响程度有所不同。此外,我们设计了一个语言接受度任务来揭示它们在识别不符合语法的句子和错误位置方面的能力。本文的结果有助于理解语言编码器对语法错误的鲁棒性和行为。