科学的相关主题模型

Aug, 2007

A correlated topic model of Science

David M. Blei, John D. Lafferty

TL;DR本文提出了相关话题模型（CTM），通过逻辑正态分布，展现留言比例的相关性，我们还推导出了适用于该模型的快速变分推理算法，并将其应用于 Science 1990-1999 年间发表的文章，数据集包括 57M 词，证明 CTM 比 LDA 拟合效果更好，并将其作为大型文本集成探索性工具。

Abstract

topic models, such as latent dirichlet allocation (LDA), can be useful tools for the statistical analysis of document collections and other discrete data. The LDA model assumes that the words of each document ari

topic models latent dirichlet allocation correlated topic model variational inference algorithm exploratory tool

发现论文，激发创造

主题模型的网络方法

采用随机块模型方法，针对主题建模中存在的问题，提出了一种更具通用性和原则性的框架，该框架能够自动检测主题数和分级群集单词和文档，从而比 LDA 在统计模型选择方面提供更好的主题模型。

Aug, 2017

作者与文档的作者 - 主题模型

我们介绍了作者 - 主题模型，它是一种生成文档的模型，扩展了隐含狄利克雷分配（LDA），包括作者信息，应用于 NIPS 会议论文和 CiteSeer 摘要，具有估算主题和作者分布的 Gibbs 采样基础上的性能比较。

Jul, 2012

核主题模型

本文研究的是 Latent Dirichlet Allocation 模型的一个变体，将文档混合比重置为 squashed Gaussian 分布，从而实现对以时间、空间、层次结构、社交等方面为特征的文档的建模，同时提出了一个基于 Laplace 近似的转化基础的近似算法以便对隐藏的高斯分布进行有效的近似推断。该 KTM 模型也可以被解释为一种 Gaussian 过程潜变量模型，或基于文档特征的主题模型，在发掘这些领域的早期工作的联系时非常有用。

Oct, 2011

监督式主题模型

介绍了一种新的统计模型 —— 监督潜在狄利克雷分配（SLDA），应用变分方法处理难以计算的后验期望，解决回答类型的多样性并预测新文档的回答数值。与现代正则化回归以及无监督 LDA 分析相比，SLDA 有显著优势。

Mar, 2010

潜在狄利克雷分配的谱算法

提出了一种名为 ECA 的学习流程，基于低阶矩的光谱分解，它可以恢复多种混合模型的参数，并在仅使用三元统计时正确恢复主题概率向量和主题优先级，因此具有可扩展性。

Apr, 2012

主题模型的平滑和推断

本文探讨了用于高维稀疏计数数据建模的潜在狄利克雷分析或话题模型，比较了多种学习算法，发现主要区别在于应用于计数的平滑量。在优化超参数时，算法性能的差异显著缩小，这使得我们能够选择计算效率高的方法来学习准确的主题模型。

May, 2012

使用潜在狄利克雷分配方法进行的关于冠状病毒的瑞典报纸文章主题建模：以案例研究为基础

该研究使用 Latent Dirichlet Allocation (LDA) 方法建模了瑞典报纸文章关于冠状病毒的主题变化，旨在支持社会经济影响研究以及临床和医疗保健分析等领域的话题建模应用。

Jan, 2023

信念传播学习主题模型

该研究提出了一种基于马尔可夫随机场框架下的因子图表示方法，实现了传统信念传播算法对隐含狄利克雷分配模型的近似推理和参数估计，该算法在速度和准确性方面均具有竞争力，并且可以成为基于 LDA 的话题模型的通用学习方案。

Sep, 2011

基于 Transformer 处理的模糊主题建模新方法

基于软聚类和文档嵌入的模糊主题建模对比传统的 Latent Dirichlet Allocation（LDA）模型，在新闻发布监测中，得到了更加自然的结果。

Sep, 2023

Dirichlet - 多项式回归条件下的任意特征主题模型

本文提出一种基于 DMR 主题模型的 log-linear 先验方法，以元数据特征为参数，以模拟文档中词汇的分布和主题的分布。实验结果表明 DMR 主题模型可以超越以往的主题模型，从而提高了对文档元数据的建模能力。

Jun, 2012