Jul, 2011

多标签文档分类的统计主题模型

TL;DR本文探讨生成性统计主题模型在多标签文档分类中的应用,相对于判别性模型,在包含大量稀有标签和高度倾斜标签分布等实际数据集的分类问题中有优越性。实验结果表明,相较于判别性方法,概率生成模型在多标签分类方面表现优异。