Jun, 2014

单词频率统计中的尺度律和波动

TL;DR通过大型文本数据库的统计分析与简单随机模型的结合,解释了单词频率统计中的尺度律出现原因及其涵义,模型表示词频分布服从 Zipf's Law,并且单词的频率受到文章主题模型中波动的影响。同时,该文章还对词汇丰富度进行了测量和分析。