LSTMs在分析助动词结构时应该/可以学习什么？

Jul, 2019

LSTMs在分析助动词结构时应该/可以学习什么？

What Should/Do/Can LSTMs Learn When Parsing Auxiliary Verb Constructions?

Miryam de Lhoneux, Sara Stymne, Joakim Nivre

TL;DR通过在不同语言中使用诊断分类器探究过渡型神经解析器中学习到的协议和传递性信息，研究发现，基于递归层的神经解析器在捕捉和表示动词成分时比双向LSTM模型更加高效和准确，但目前还未找到将其最佳融合方式。

Abstract

This article is a linguistic investigation of a neural parser. We look at transitivity and agreement information of auxiliary verb constructions (AVCs) in comparison to finite main verbs (FMVs). This comparison i

发现论文，激发创造

评估LSTMs学习句法敏感依赖能力

本研究使用长短期记忆神经网络（LSTM）来探讨其在语言处理中捕捉句法结构的能力，结果表明，在受到显式语法目标的监督时，LSTM可以捕捉相当数量的语法结构，但是需要更强的架构来进一步减少错误，且语言建模信号不足以捕捉句法敏感的依赖关系，需要更直接的监督。

Nov, 2016

LSTM能否学会捕捉一致性？以巴斯克语为例

该研究主要探讨了顺序神经网络模型在巴斯克语中的一项任务——协议预测，发现这些模型在协议预测上表现不如预期，并提出巴斯克协议预测任务作为学习自然语言正则性的具有挑战性的基准测试。

Sep, 2018

语言模型教给你的句法知识比翻译多：通过辅助任务分析所学到的教训

该研究比较了四种不同的预训练目标（语言模型、翻译、跳跃思考和自编码）对模型学习语言信息和句法信息的影响，结果表明语言模型对于转移学习和需要句法信息的应用最为适合。

Sep, 2018

使用合成自然语言变体研究RNN的归纳偏置

研究了神经序列模型通过 typological properties 如词序和形态格标示来获取一种语言的语法的能力，针对这种种类繁多的语法特征和训练语料之间的复杂交互，作者使用了从英文中生成一些与英文在一个或多个语言学特性上不同的合成语言来避免影响，研究表明诸如 SVO 词序、多个格标示等特性可以有效提高合成语言的一致性效果。

Mar, 2019

解析全部：句法和语义、依存关系和跨度

本研究提出了一种新的基于神经网络的两种表征形式（span和dependency）的句法和语义联合模型，该模型有效地整合了句法信息，最大化优化联合目标，试验结果表明语义和句法可以相互促进，以全新的表现水平取得了 Propbank 基准测试集上的最好成绩。

Aug, 2019

将语言类型学纳入神经依存句法分析中的挑战

本研究探讨了在跨语言依赖分析的背景下，如何利用类型学来提高性能，而我们的主要发现是将语言聚合成句法同质性群组有助于性能，而将类型维度进行组合式学习的效果并不显著。同时，考虑到所选择语料库的列统计学与类型学相一致时，性能表现也将更为出色。

Sep, 2019

句法表示有用[MASK]：递归LSTMs中成分和依存结构的影响

研究基于序列的神经网络与基于树的网络在句法任务上的表现，并比较常见的句法表示方法对句法结构带来的影响，同时发现基于组成结构的网络更具鲁棒性，通过少量构建的数据fine-tune可以显着提高序列模型的性能，表明数据增强是为序列模型注入句法偏置的可行替代方案。

Apr, 2020

神经语言模型中语法一致机制的因果分析

通过因果中介分析方法研究预训练神经语言模型，揭示模型在困难情境下表现主语-谓语服务一致性的机制，研究发现模型的偏好程度及神经元对于主语-谓语一致性处理在语法结构不同的句子中存在相似性和差异性，同时表明了不同体系结构和规模的语言模型的相似性和差异性，以及主语-谓语一致性生成的两个不同机制。

Jun, 2021

Transformer模型是现代版ELIZA吗？对法语主谓一致的观察

本研究通过分析长距离语法结构的结果显示，与LSTMs相反，Transformers能够捕捉到相当数量的语法结构，从而对神经网络的句法能力评估提出质疑。

Sep, 2021

基于语言模型的分析器中的结构歧义及其消解：以荷兰从句关系为例

本文研究荷兰语定语从句的结构歧义，通过研究基于语境的消歧任务，探讨前一句话的存在如何解决定语从句的歧义，应用此方法于两种句法分析结构，结果表明基于证明网的神经符号句法分析器比基于通用依赖的方法更容易纠正数据偏见，然而两种设定都受到相应的初始数据偏见的影响。

May, 2023