无需大量监督即可出现语法
本研究介绍了一种新的全自动、无监督的从大型文本语料库中提取依赖语法和相关语法到语义关系映射的方法,若成功,该方法将使得直接从大型未注释语料库中挖掘出用于自然语言理解和生成的所有信息成为可能。
Jan, 2014
本研究介绍了一个自动框架,旨在通过自动发现和可视化语法的不同方面来促进语言教学,其中从自然语料库中提取描述单词排序、一致性、语法标记或词形成及词汇学习的描述,并显示例证。作者在印度语言 Kannada 和 Marathi 上应用此方法,以评估其实用性,并邀请北美的语言教育家对这些语言进行手动评估。教师们认为这些材料有趣,可以用作自己的课程准备或学习者评估的参考资料。
Jun, 2022
本文介绍了一种新的方法 SSUD,通过利用语法关系的一个属性 —— 语法替换性,不需要监督下拉金标准解析,就能诱导出语法结构,从而帮助理解大型预训练语言模型(LLMs)的句法能力,提高依赖分析任务的定量和定性效果。
Nov, 2022
本论文研究了无监督机器学习在自然语言方面的应用,提出了三种新算法,旨在考察 “刺激贫乏” 问题以验证人类是否具有特定内在语言知识,最终得出刺激贫乏论不受证据支撑的结论。
Dec, 2002
该研究提出了一种基于语法规则的非监督句法树生成方法,利用了语言的通用语法知识,采用强化学习和自编码器等技术,在 MNLI 和 WSJ 两个基准数据集上实现了最好的结果。
May, 2021
人们如何获取句法类别知识是基础性问题,本研究回顾了各种工程方法,目的在于无需先验句法知识就能正确识别样本文本中的词性,并讨论了模型的评估、约束因素以及上下文对词性的确定等共同主题。这些主题为深入研究认知过程奠定了基础,并提供了当前无监督词性标注模型的有用参考。
Dec, 2023
本文提出了基于语言结构的机器学习任务,并通过三种方案展示了其潜力和可行性,包括通过视觉基现学习语法结构,通过执行感知方法映射句子到语义结构,并通过跨语言词对齐和子结构投影方法改进零样本跨语言依赖分析的性能。
Jun, 2024
本文介绍了一种弱监督方法,用于在完全没有标记数据的情况下推断单词和表达式的抽象性质,利用最少的语言线索和概念在文本数据中的上下文使用,训练具有足够强大的分类器,取得了与人标记的高相关性,结果表明这种方法适用于其他概念属性、其他语言和资源缺乏的情况。
Sep, 2018