Nov, 2022

基于语料库的语法中曝露与出现:在 35 种语言中的计算实验

TL;DR本文使用计算实验来探讨暴露在实际语言使用中对于构式语法出现的作用,并实验证明词汇表的增长速度比语法更快,而且语法的增长速度并不依赖于词汇表的增长速度。同时,面向特定寄存器的语法在暴露量增加时会收敛到更相似的结构中,这意味着随着曝光量的增加,特定寄存器的影响变得越来越不重要。最后,本文提出了一个计算模型,包括构式语法的出现和未压缩。