关键词probabilistic latent semantic analysis
搜索结果 - 2
- Top2Vec:主题的分布式表示
提出了一种基于分布式语义嵌入的主题建模方法 top2vec,不需要预定义的停用词表、词干提取或词形还原等预处理,能够自动确定主题数目,有效地提取语义信息并以主题向量的形式呈现。实验结果表明,top2vec 比传统的生成模型更加优秀。
- 概率隐含语义分析
该文章介绍了概率隐含语义分析技术,其应用于信息检索和过滤、自然语言处理和文本机器学习等领域,该方法是一种基于潜在类模型的混合分解,避免了过度拟合,相比于标准的潜在语义分析方法,在多个实验中得到了显著且一致的改进。