神经语言模型中的成分结构探测

Apr, 2022

Probing for Constituency Structure in Neural Language Models

David Arps, Younes Samih, Laura Kallmeyer, Hassan Sajjad

TL;DR本文研究神经语言模型对句法结构的学习能力，发现预训练的 Transfomer LM 即使在语义有错的情况下仍能准确地代表不同类别的成分，并且语法信息确实被 LM 学习并与语义信息分离。

Abstract

In this paper, we investigate to which extent contextual neural language models (LMs) implicitly learn syntactic structure. More concretely, we focus on constituent structure as represented in the Penn Treebank (PTB). Using standard probing techniques based on →

neural language models syntactic structure diagnostic classifiers transformer lms constituency information

发现论文，激发创造

从语言模型中归纳语言结构

该论文研究了从语言模型中以无监督方式生成组成和依赖结构的问题，并通过一系列实验表明了其在语法结构识别方面的可行性和存在的限制。

Mar, 2024

探究上下文词向量的句子结构学习

研究比较四种最近的模型对句子结构的编码情况，发现语言模型和翻译模型训练出的模型对句法现象具有强大的表现，但对语义任务的改进相对较小。

May, 2019

基于 LLMs 的短语结构解析

运用大型语言模型探索生成线性化树解决成分句法分析任务，并通过实验证明模型的性能、泛化能力和挑战。

Oct, 2023

句法表示有用 [MASK]：递归 LSTMs 中成分和依存结构的影响

研究基于序列的神经网络与基于树的网络在句法任务上的表现，并比较常见的句法表示方法对句法结构带来的影响，同时发现基于组成结构的网络更具鲁棒性，通过少量构建的数据 fine-tune 可以显着提高序列模型的性能，表明数据增强是为序列模型注入句法偏置的可行替代方案。

Apr, 2020

跨语言和语法下预训练模型的评估

我们提出了一种评估多语言大型语言模型在多形式语法结构方面学习句法的方法，将分析转化为序列标记，通过选择几个语言模型并在 13 个多样化的依赖解析树库和 10 个成分解析树库上研究它们，结果表明：（i）该框架在多种编码上一致，（ii）预先训练的词向量不偏好成分句法表示，而是倾向于依赖表示，（iii）子词标记化需要用于表示语法，与基于字符的模型不同，（iv）从词向量中恢复语法时，语言在预训练数据中的出现比任务数据的数量更重要。

Sep, 2023

神经成分句法分析器的研究分析

研究了现代和经典的组成分析方法的差异，以及神经网络在此领域的应用。高性能的神经模型代表了最新的工作，实验发现该模型隐式编码了过去语法和词汇表明确提供的信息，暗示这种支撑可以被强大的通用神经机制取代。

Apr, 2018

人类和大型语言模型中潜在成分表示的主动运用

人脑与大型语言模型在句子内部表征方面具有相似的层级结构，通过删除单词来推断句子的潜在分层结构，并证明了这种结构在人脑和语言模型中都能出现。

May, 2024

听觉中大脑的句法结构处理

本文从语法分析的角度出发，通过探索不同的句法分析方法和语法特征对大脑语言网络的影响，以及与语义信息的关系，研究了其对大脑活动的预测能力，发现不同的语法分析方法在大脑不同区域的编码效果不同，而语法信息和语义信息的结合能够更好地预测大脑活动。

Feb, 2023

在神经堆栈中寻找句法表示

本文通过探究无监督条件下对成分结构的学习，提出了使用一种技术从堆叠循环神经网络的推送行为中提取句法树，证明堆叠循环神经网络确实推断出了具有语言学相关的层次结构。

Jun, 2019

预训练语言模型是否能识别短语？语法归纳的简单但强大的基准线

介绍了一种利用预训练语言模型提取短语结构树的方法，并发现预训练语言模型在正确划分句子中的副词短语方面表现优异，从而有助于进一步理解预训练语言模型的内部机制。

Jan, 2020