在词序变异中最小化交换距离超越熵最小化
语言中的距离最小化是一般原则,其特例是词序中的交换距离最小化。本文探讨了该原则在主语(S)、宾语(O)和动词(V)三者组成的三元组中的表现,并引入了词序旋转的概念作为预测的认知基础。结果表明,在三种灵活顺序 SOV 语言(韩语、马拉雅拉姆语和僧伽罗语)中均存在交换距离最小化的证据,但在僧伽罗语中较为弱。在韩语和尤其是马拉雅拉姆语中,交换距离最小化比对规范顺序的偏好更为突出。
Dec, 2023
通过空间网络将句子中单词的语法依赖关系表示为优化问题,引入新的评分方法来量化减少单词距离的认知压力,研究 93 种语言的句子,发现这种方法能准确评估大约一半的语言的优化水平,并对各个领域的语言研究提供了启示,特别是对网络科学有重要意义。
Jul, 2020
通过 80 种语言的语料和系统发展模型,研究说明了单个语言中词序变化的频率分布和演化,说明词序变异反映了语言在维持总体有效性方面优化竞争压力的不同方式。研究结果表明,语法结构和使用在有限的认知资源下相互协调以支持有效沟通。
Jun, 2022
本文提供一种新的算法来计算句子的依存距离期望值,在统计上足够准确,时间复杂度为 $n$。此外,文章还发现了星形树(star tree)在该算法中具有最大化作用,提出了一种可以找到最小化依存距离期望值的树的算法。
Jul, 2021
从信息论的角度出发, 增加了一个竞争性的语序原则:目标元素可预测性的最大化,进一步完善了词序的数学理论。 然而依存长度的最小化与可预测性最大化之间存在矛盾,对于头的最大化可预测性,头应该出现在最后,这最大化了相对于依存长度最小化的成本。本文回顾了这种广泛的理论框架对于理解主语,宾语和动词 6 种可能排序的最优性,多样性和演化的影响。
May, 2017
本文提出了一种新的双指数模型,探讨了句子的句法结构和依赖距离分布及其与短期记忆限制之间的关系,并通过最近引入的优化分数,解释了最佳估计模型与句法依赖的紧密程度之间的关系。
Nov, 2022
本文探讨了语言处理中的单词顺序问题,并提出了基于语言学、心理语言学、计算语言学和自然语言处理的理论模型。进一步,为了优化处理单词最小化相关性,提出一种新的单词顺序,重点关注远距离依赖的人类和计算语言处理困难。最后探讨这些单词顺序对于人类语言和计算模型的影响。
Aug, 2021