评估基于儿童语言训练的神经网络中的层次泛化能力

Jan, 2023

评估基于儿童语言训练的神经网络中的层次泛化能力

How poor is the stimulus? Evaluating hierarchical generalization in neural networks trained on child-directed speech

Aditya Yedetore, Tal Linzen, Robert Frank, R. Thomas McCoy

TL;DR本研究以 LSTMs 和 Transformers 为例子，通过与儿童语言输入类似的数据培训这两种没有分层偏见的神经网络，进而评估它们对英语的 yes/no 问题的理解。研究结果表明，在使用文本自然语言作为语言输入时，这两种模型都更接近于错误的线性规则而非正确的层级规则，推测人类对自然语言的依赖性需要更强的偏见。

Abstract

When acquiring syntax, children consistently choose hierarchical rules over competing non-hierarchical possibilities. Is this preference due to a learning bias for hierarchical structure, or due to more general biases that interact with hierarchical cues in children's linguistic input?

syntax acquisition learning bias hierarchical structure neural networks language processing

发现论文，激发创造

重访刺激的贫乏：循环神经网络中的层次泛化之无层次偏差

本研究使用循环神经网络探讨了语言学习者偏好使用分层规则的原因，发现循环神经网络架构的隐含偏见和语言内在层次结构线索结合可以诱导分层概括规则的习得。

Feb, 2018

序列到序列网络中的层级归纳偏差源：语法需要生长在树上吗？

研究神经序列到序列模型中的归纳偏差如何影响其推广行为，发现只有采用具有语法结构的树状模型才能保持类人语法推广能力。

Jan, 2020

无需种植树木的语法学习：理解变换器何时以及何种方式实现分层普遍化

透过对自然语言数据训练的 Transformer 模型的研究和实验证明，具备语言建模目标的 Transformer 模型更容易学习和推广层次结构，并在处理无法预见的句法结构的句子时表现优异。

Apr, 2024

神经网络是否可以从原始语言数据中获得结构偏见？

通过针对不同结构相关现象的四个实验，我们评估了 BERT 在原始数据的预训练过程中是否获得了形成结构化概括的归纳偏差，并发现 BERT 在实体 - 助动词倒装，反身代词，以及嵌套从句中动词时态检测中进行了结构化概括，但在 NPI 许可证检测中进行了线性概括，这是迄今为止最有力的支持从原始数据中获取结构性偏差的人工学习器研究结果之一。

Jul, 2020

语言的深度学习易度是由什么决定的？

通过在人工语言学习研究中复制并测试深度神经网络学习新语言的记忆和推广能力，我们在神经网络与人类之间发现了惊人的相似性，并发现结构化语言输入在提高神经网络系统化概括和记忆错误方面的效果与自然语言存在高度相关性。

Feb, 2023

神经网络与乔姆斯基层次结构

通过在 20,910 个模型和 15 个任务上进行广泛的实证研究，我们展示了按照 Chomsky 层次分类任务可以预测特定体系结构的广义能力。结果表明，只有增加了结构化记忆的网络（例如堆栈或内存带）才能成功地推广上下文自由和上下文相关的任务。

Jul, 2022

神经语言模型中的分层表示：期望的抑制和恢复

本研究旨在探究神经语言模型是否能够在单线性序列输入的情况下提取层次信息，并通过中心嵌套句子和语法岛约束等自然语言现象的实验研究证明：LSTM 能够识别和利用堆栈数据结构来存储和获取一定数量的语言层次结构。

Jun, 2019

语言模型中如何种植树木：数据和架构对句法归纳偏差发生的影响

本文研究了预训练模型在通用语言中层次化句法功能的作用，通过诊断语法转换任务来诊断预训练参数的归纳偏差，结果表明，模型深度对于层次化泛化具有更大的作用，同时，在训练规模方面，使用适当的语料库预训练可以提高效率。

May, 2023

香草 Transformer 中的分层结构理解

本文研究了神经序列和转换语言模型的层次结构泛化能力，发现通过长时间训练，模型能够学习到层次结构的一般性，对模型深度的分析证明浅层和深层不如中等深度的模型性能优秀。此发现证实了香草珂朵莉模型能够发现和使用自然语言中的层次结构。

May, 2023

神经语言模型中的语法推广的系统评估

我们对神经语言模型的句法知识进行了系统评估，发现模型架构的不同对句法泛化性能产生了显著影响，而不同数据集大小的影响相对较低。

May, 2020