May, 2016

层次主题检测的潜在树模型

TL;DR我们提出了一种新颖的分层主题检测方法,使用层次潜在树模型来对文档进行聚类并检测主题,该模型使用二元变量来表示文档中单词的存在 / 缺失,并利用树形结构建模主题和单词之间的关系,因此不需要引用文档生成过程,有助于发现有意义的主题和主题层次结构。