ACLDec, 2020

非自然语言推论

TL;DR通过一个明确的指标,我们提出了多种度量方法,并研究了哪些特定的排列方式使得大型 Transformer NLU 模型在自然语言推理任务中对随机词序具有一定程度的规律性。我们对此现象进行了综合实证评估,发现无论是基于 Transformer 还是基于 pre-Transformer RNN / ConvNet 结构的编码器,以及跨多种语言(英语和中文)都存在此问题,并提供相关数据和代码。