ACLSep, 2021

语言模型中的结构稳定性:启动作为窥视抽象语言表征的窗口

TL;DR研究现代神经语言模型在结构启动方面的易感性,探讨如何利用启动来研究这些模型学习抽象结构信息的潜力,引入新度量和发布大型语料库 Prime-LM,发现 Transformer 模型确实显示结构启动的证据,但也显示出它们学习的概括在某种程度上受语义信息的调节,综合实验表明,模型获得的表示不仅编码抽象的连续结构,还涉及某些层次的句法信息。