语言模型中的结构稳定性：启动作为窥视抽象语言表征的窗口

ACLSep, 2021

语言模型中的结构稳定性：启动作为窥视抽象语言表征的窗口

Structural Persistence in Language Models: Priming as a Window into Abstract Language Representations

Arabella Sinclair, Jaap Jumelet, Willem Zuidema, Raquel Fernández

TL;DR研究现代神经语言模型在结构启动方面的易感性，探讨如何利用启动来研究这些模型学习抽象结构信息的潜力，引入新度量和发布大型语料库 Prime-LM，发现 Transformer 模型确实显示结构启动的证据，但也显示出它们学习的概括在某种程度上受语义信息的调节，综合实验表明，模型获得的表示不仅编码抽象的连续结构，还涉及某些层次的句法信息。

Abstract

We investigate the extent to which modern, neural language models are susceptible to structural priming, the phenomenon whereby the structure of a sentence makes the same structure more probable in a follow-up se

neural language models structural priming abstract structural information transformer models hierarchical syntactic information

发现论文，激发创造

多语言语言模型中展示抽象语法表示的结构启动实证

大型语言模型中存在类似人类的抽象的单语和跨语言语法表示，这些语法表示在不同语言中可以产生因果影响。

Nov, 2023

语言模型展示人类类似的结构启动效应吗？

我们研究了语言模型预测中在句子和单词级别发挥重要作用的语言因素，并调查这些因素是否反映了人类和人类语料库中的结果。我们利用结构启动范式，其中对结构的最近暴露有助于相同结构的处理。我们不仅调查了引导效果是否发生，还调查了它们发生的位置以及预测它们的因素。我们表明，这些效应可以通过逆频率效应来解释，即在人类引导中众所周知，引导中的较罕见元素增加引导效果，以及引导和目标之间的词汇依赖性。我们的结果为如何理解上下文中的属性如何影响语言模型中的结构预测提供了重要线索。

Jun, 2024

使用启发式方法揭示神经语言模型中的句法表示组织

提出了一种新的技术来分析神经语言模型在句法结构敏感性方面的代表性，并证明 LSTM LMs 对于具有关系从句的不同类型的句子的表示是按照语言可解释的层次结构组织的，表明 LMs 跟踪句子的抽象属性。

Sep, 2019

跨语言结构引导及双语语言模型的预训练动态

多语言语言模型是否在不同语言之间共享抽象语法表示以及这些抽象语法表示是何时形成的？我们使用结构启动测试进行研究，发现跨语言结构启动效应在第二语言曝光不到 1M 标记的数据后就会早期显现，并讨论了数据污染、低资源转移以及多语言模型中抽象语法表示形成的意义。

Oct, 2023

建模双语句子处理：评估 RNN 和 Transformer 体系结构用于跨语言结构启动

通过评估循环神经网络（RNN）和 Transformer 在复制跨语言结构启动方面的表现，这项研究对人类语言处理中抽象语法表示的关键指标进行了评估。研究重点关注涉及两种类型不同的语言的中英启动，探讨这些模型如何处理结构启动这一稳定现象，即暴露于特定句子结构会增加之后选择类似结构的可能性。此外，我们还利用大型语言模型（LLM）来衡量跨语言结构启动效果。研究结果表明 Transformer 在生成启动句子结构方面的性能优于 RNN，挑战了人类句子处理主要涉及循环和即时处理的传统观念，同时表明了基于线索的检索机制的作用。总体而言，这项工作对于了解计算模型如何反映多语言环境中人类认知过程具有重要贡献。

May, 2024

一个简单且统一的标记模型，带有引导作用，用于关系结构预测

通过使用 Tagging 模型，对预先训练好的语言模型的输入序列增加预处理，从而提高关联结构提取的精度，并在多语言数据集上进行了广泛的实验及分析，并提出了一种快速且准确的近似方法

May, 2022

大语言模型中的语言普适性有多抽象？论阐探有关论证结构

Transformer-based large language models perform well in generalizing word distributions in related contexts seen during pre-training, but fail in generalizations between unobserved contexts by relying on linear order instead of more abstract structural generalizations.

Nov, 2023

Transformer 语言模型的结构指导

本论文研究了在不需要大量预训练的情况下，以结构为导向的指导是否能够使 Transformer 语言模型学习更接近人类的系统语言泛化。通过在 BLLIP 数据集上对两种新模型进行实验，研究者发现引入结构性解析的辅助训练能够提高 Transformer 语言模型在句法推理上的泛化能力。

Jul, 2021

跨语言事件抽取的语言模型预训练

本篇研究提出了一个新颖的、与语言无关的方法来对语言模型进行 “引导”，从而在低资源和零 - shot 跨语言环境中提供特别有效的性能。

Sep, 2021

基于认知动机的解析器生成结构启动预测

使用一种新的认知动机解析器，基于实证启动模式的理论可以生成关于结构表示形式的定量预测，并通过实证的人类行为评估这些预测。本研究以简化的限定性从句表示作为案例研究应用该框架，并发现只有理论之一（分词 - 阶段论）的预测与实证启动模式相一致，从而突显了关于限定性从句更好地捕捉人类句子表示形式的假设。

Mar, 2024