Jul, 2009

关于量化书面语言所编码的语义信息的探索

TL;DR本文研究书面语的信息编码和语义特征,利用信息论的方法分析书面语中词汇的分布和使用,探求了主题 - 词汇频率关系。研究结果表明,在每个文本中,频率高的词汇与主题的相关性更大,这种现象可以用特征大小和分布模型来解释。