采用随机块模型方法,针对主题建模中存在的问题,提出了一种更具通用性和原则性的框架,该框架能够自动检测主题数和分级群集单词和文档,从而比 LDA 在统计模型选择方面提供更好的主题模型。
Aug, 2017
我们介绍了作者 - 主题模型,它是一种生成文档的模型,扩展了隐含狄利克雷分配(LDA),包括作者信息,应用于 NIPS 会议论文和 CiteSeer 摘要,具有估算主题和作者分布的 Gibbs 采样基础上的性能比较。
Jul, 2012
本文研究的是 Latent Dirichlet Allocation 模型的一个变体,将文档混合比重置为 squashed Gaussian 分布,从而实现对以时间、空间、层次结构、社交等方面为特征的文档的建模,同时提出了一个基于 Laplace 近似的转化基础的近似算法以便对隐藏的高斯分布进行有效的近似推断。该 KTM 模型也可以被解释为一种 Gaussian 过程潜变量模型,或基于文档特征的主题模型,在发掘这些领域的早期工作的联系时非常有用。
Oct, 2011
介绍了一种新的统计模型 —— 监督潜在狄利克雷分配(SLDA),应用变分方法处理难以计算的后验期望,解决回答类型的多样性并预测新文档的回答数值。与现代正则化回归以及无监督 LDA 分析相比,SLDA 有显著优势。
Mar, 2010
提出了一种名为 ECA 的学习流程,基于低阶矩的光谱分解,它可以恢复多种混合模型的参数,并在仅使用三元统计时正确恢复主题概率向量和主题优先级,因此具有可扩展性。
Apr, 2012
本文探讨了用于高维稀疏计数数据建模的潜在狄利克雷分析或话题模型,比较了多种学习算法,发现主要区别在于应用于计数的平滑量。在优化超参数时,算法性能的差异显著缩小,这使得我们能够选择计算效率高的方法来学习准确的主题模型。
May, 2012
该研究使用 Latent Dirichlet Allocation (LDA) 方法建模了瑞典报纸文章关于冠状病毒的主题变化,旨在支持社会经济影响研究以及临床和医疗保健分析等领域的话题建模应用。
Jan, 2023
该研究提出了一种基于马尔可夫随机场框架下的因子图表示方法,实现了传统信念传播算法对隐含狄利克雷分配模型的近似推理和参数估计,该算法在速度和准确性方面均具有竞争力,并且可以成为基于 LDA 的话题模型的通用学习方案。
Sep, 2011
基于软聚类和文档嵌入的模糊主题建模对比传统的 Latent Dirichlet Allocation(LDA)模型,在新闻发布监测中,得到了更加自然的结果。
Sep, 2023
本文提出一种基于 DMR 主题模型的 log-linear 先验方法,以元数据特征为参数,以模拟文档中词汇的分布和主题的分布。实验结果表明 DMR 主题模型可以超越以往的主题模型,从而提高了对文档元数据的建模能力。
Jun, 2012