Jan, 2022

数据损坏对自然语言理解模型的影响:对 GLUE 数据集的研究

TL;DR本论文针对自然语言理解研究的核心问题,以预训练语言模型为研究对象,通过对数据进行特定破坏转换使其变为无意义的句子,考察了在非意义上下文中该模型的判断能力,发现即便是在数据被破坏之后,该模型在大部分 GLUE 任务上的表现依旧保持较高水平,说明其在预测过程中利用了其他提示信息,同时引入了数据转换的概念,为评估模型语言理解能力提供了一种新方法。