无需大量监督即可出现语法

ACLMay, 2020

Emergence of Syntax Needs Minimal Supervision

Raphaël Bailly, Kata Gábor

TL;DR本文探讨如何在没有专门的句法指导的语料库中从语料学习句法的可行性，以语料库的观察结构为基础，通过定义和隔离语法和意义 / 语用学信息，我们描绘了自主语法的形式特征，并展示了通过简单的优化过程搜索基于语法的词汇类别，而无需对模型形式做任何先验假设的可能性。

Abstract

This paper is a theoretical contribution to the debate on the learnability of syntax from a corpus without explicit →

learnability syntax corpus grammaticality lexical categories

发现论文，激发创造

从大型（未标注）语料库中学习语言

本研究介绍了一种新的全自动、无监督的从大型文本语料库中提取依赖语法和相关语法到语义关系映射的方法，若成功，该方法将使得直接从大型未注释语料库中挖掘出用于自然语言理解和生成的所有信息成为可能。

Jan, 2014

自动提取语法知识对 L2 语言学习的教师感知

本研究介绍了一个自动框架，旨在通过自动发现和可视化语法的不同方面来促进语言教学，其中从自然语料库中提取描述单词排序、一致性、语法标记或词形成及词汇学习的描述，并显示例证。作者在印度语言 Kannada 和 Marathi 上应用此方法，以评估其实用性，并邀请北美的语言教育家对这些语言进行手动评估。教师们认为这些材料有趣，可以用作自己的课程准备或学习者评估的参考资料。

Jun, 2022

L2 语言学习的自动提取语法概念的教师感知

通过自动发现和可视化语法描述，本研究旨在帮助语言教育专家自动创建材料，以便教授印度语言中的语法和语义知识。

Oct, 2023

基于语法依赖的无监督句法代换

本文介绍了一种新的方法 SSUD，通过利用语法关系的一个属性 —— 语法替换性，不需要监督下拉金标准解析，就能诱导出语法结构，从而帮助理解大型预训练语言模型（LLMs）的句法能力，提高依赖分析任务的定量和定性效果。

Nov, 2022

无监督语言习得：理论与实践

本论文研究了无监督机器学习在自然语言方面的应用，提出了三种新算法，旨在考察 “刺激贫乏” 问题以验证人类是否具有特定内在语言知识，最终得出刺激贫乏论不受证据支撑的结论。

Dec, 2002

规则增强的无监督短语结构句法分析

该研究提出了一种基于语法规则的非监督句法树生成方法，利用了语言的通用语法知识，采用强化学习和自编码器等技术，在 MNLI 和 WSJ 两个基准数据集上实现了最好的结果。

May, 2021

AUTOLEX：一个自动语言探索框架

AutoLEX 是一个自动框架，旨在帮助语言学家发现和提取语言现象的简洁描述，如形态一致性、格标记和词序。

Mar, 2022

无监督词性标注的综述及其对语言习得的启示

人们如何获取句法类别知识是基础性问题，本研究回顾了各种工程方法，目的在于无需先验句法知识就能正确识别样本文本中的词性，并讨论了模型的评估、约束因素以及上下文对词性的确定等共同主题。这些主题为深入研究认知过程奠定了基础，并提供了当前无监督词性标注模型的有用参考。

Dec, 2023

通过基于实景的学习掌握语言结构

本文提出了基于语言结构的机器学习任务，并通过三种方案展示了其潜力和可行性，包括通过视觉基现学习语法结构，通过执行感知方法映射句子到语义结构，并通过跨语言词对齐和子结构投影方法改进零样本跨语言依赖分析的性能。

Jun, 2024

利用弱监督学习概念抽象度

本文介绍了一种弱监督方法，用于在完全没有标记数据的情况下推断单词和表达式的抽象性质，利用最少的语言线索和概念在文本数据中的上下文使用，训练具有足够强大的分类器，取得了与人标记的高相关性，结果表明这种方法适用于其他概念属性、其他语言和资源缺乏的情况。

Sep, 2018