通过句法距离和地理邻近性探索语言关系
通过空间网络将句子中单词的语法依赖关系表示为优化问题,引入新的评分方法来量化减少单词距离的认知压力,研究 93 种语言的句子,发现这种方法能准确评估大约一半的语言的优化水平,并对各个领域的语言研究提供了启示,特别是对网络科学有重要意义。
Jul, 2020
通过比较词汇的遗传距离,在 Swadesh 列表中对同义词进行归一化的 Levenshtein 距离计算,提出了一种降低个人判断主观性的语言之间遗传距离计算方法,并利用该方法构建了一种印欧语系的语言树。
Aug, 2007
本研究采用多任务学习方法,通过预测单词和语法距离(即基于真实解析树的距离值)的方式,相互共享中间表示,以有效且高效地融入句法结构于神经语言模型中, 实验表明,提供基于真实解析树的训练信号,能够降低困惑度并生成更好的语法树。
May, 2020
本文从实证及计算两方面主要探讨使用更多的语言类型学数据作为语言史前迁徙、语言之间深层系统关系及语言交互模式更准确研究和预测的可行性,重点解决了实证方法、计算模拟等方面的问题,并得出通过语言类型学数据能得出新的语言史前迁徙证据的结论。
Jul, 2006
本文提出了一种新的双指数模型,探讨了句子的句法结构和依赖距离分布及其与短期记忆限制之间的关系,并通过最近引入的优化分数,解释了最佳估计模型与句法依赖的紧密程度之间的关系。
Nov, 2022
语言间的词汇相似性表明它们可能存在遗传关系,然而这些相似性也可能是偶然的,并不总是意味着潜在的遗传关系。本文提出了一种似然比检验的方法来确定语言之间的关系,并评估了一些语系,证明了该检验的可行性和支持了宏观语系的存在。
Mar, 2024
Liu et al. (2017) provides a comprehensive report on research of dependency distance in human languages, while also identifying areas where computational linguistics can inform research on this subject, potentially leading to improved understanding of language evolution and effective computer systems.
May, 2017
引入了一个可以区分树结构的图多项式来表达依存语法,并基于多项式表示引入了一种量化句子语法相似度的方法。通过将这个基于多项式的方法运用到分析并比较不同语言中的句子与其翻译之间的句法以及在已有语料库中进行语法学的类型学研究,最后探讨并展示了这种方法在衡量语料库的句法多样性方面的潜力。
Nov, 2022
人们如何获取句法类别知识是基础性问题,本研究回顾了各种工程方法,目的在于无需先验句法知识就能正确识别样本文本中的词性,并讨论了模型的评估、约束因素以及上下文对词性的确定等共同主题。这些主题为深入研究认知过程奠定了基础,并提供了当前无监督词性标注模型的有用参考。
Dec, 2023