EMNLPSep, 2021

在芝麻街上摇动句法树:使用可控扰动进行多语言探索

TL;DR探究了文本扰动对 Transformer-based 语言模型的影响,发现换序对模型下游任务性能影响不大,且证实模型对位置编码的使用。研究使用三种印欧语言建立九个 probing 数据集,发现句法敏感度取决于语言和预训练目标,在层数和扰动粒度上敏感度增加且模型几乎不用位置信息产生句法树。