Apr, 2012

语言复杂度的实用方法:维基百科案例研究

TL;DR使用维基百科的英语文本,对简单英语维基百科和主要英语维基百科进行了语言复杂度的统计分析,发现虽然简单英语的语言词汇更简化,但实际上与主要英语的词汇丰富程度相同;同时通过更长的单元(单词和词性标记)的详细分析发现,简单英语相对于主要英语主要表现在使用更短的句子,而不是显著简化的语法或词汇。Gunning 可读性指数的比较也支持了这个结论。此外,该研究进一步分析了语言复杂度与文章主题依赖性之间的关系,并发现概念性文章中的语言更为高级。最后,研究还对话题和语言复杂度之间的关系进行了调查,并得出结论说,有争议性的文章更容易降低语言复杂度。