ACLApr, 2018

人类语言序列的泰勒定律

TL;DR本文描述了一种用于自然语言中的泰勒定律度量的新方法,并对跨 14 种语言的 1100 个文本进行了分析,发现书面自然语言文本的泰勒指数呈现几乎相同的值,同时,还比较了其他语言相关数据的泰勒指数,结果显示出泰勒指数可用于量化语言时间序列的基本结构复杂性,文章还展示了这些发现在评估语言模型方面的适用性。