May, 2015

计算语言学中的语言排名多样性:通用行为

TL;DR该研究介绍了一种对时间变化中词汇排名进行测量的“排名多样性”分布,并通过对六种欧洲语言的1800年至今的书籍进行实证研究,发现其呈现出普遍的对数正态分布。研究者们提出了一种高斯随机漫步模型来解释这些单词在时间中的排名变化,这些变化可以理解为排名的随机波动,其中变化的大小取决于其本身的排名,并发现这种分布的核大小在所有研究的语言中都相似。