May, 2024

依赖局部性能预测印地语的非典型词序?

TL;DR通过在印地语 - 乌尔都语树库 (Hindi-Urdu Treebank corpus) 中提取包含明确定义的主语和宾语的句子,并对这些句子的前谓语成分进行有系统的排列,我们测试了依赖长度最小化作为非典型 (OSV) 句法选择的重要预测因素的假设,尤其是在控制给定性和意外度等信息状态的情况下。研究结果显示,虽然非典型的原始语料库句子倾向于在生成的语料库变体中最小化依赖长度,但这一因素在辨别原始语料库句子时并没有显著贡献,超出意外度和给定性的衡量。值得注意的是,话语可预测性成为成分顺序偏好的主要决定因素。这些研究结果得到了 44 名母语为印地语的受试者的人工评价的进一步支持。总的来说,本研究揭示了期望适应在词序决策中的作用,并将结果置于话语产生和信息局部性理论之中。