监督式主题模型

Mar, 2010

Supervised Topic Models

David M. Blei, Jon D. McAuliffe

TL;DR介绍了一种新的统计模型 —— 监督潜在狄利克雷分配（SLDA），应用变分方法处理难以计算的后验期望，解决回答类型的多样性并预测新文档的回答数值。与现代正则化回归以及无监督 LDA 分析相比，SLDA 有显著优势。

Abstract

We introduce supervised latent dirichlet allocation (sLDA), a statistical model of labelled documents. The model accommodates a variety of response types. We derive an approximate maximum-likelihood procedure for parameter estimation, which relies on →

supervised latent dirichlet allocation variational methods parameter estimation prediction problems regularized regression

发现论文，激发创造

潜在狄利克雷分配的谱算法

提出了一种名为 ECA 的学习流程，基于低阶矩的光谱分解，它可以恢复多种混合模型的参数，并在仅使用三元统计时正确恢复主题概率向量和主题优先级，因此具有可扩展性。

Apr, 2012

一种高再现性和高准确度的自动化主题分类方法

通过比较 LDA 和社区检测算法的优缺点，该研究提出一种用于主题发现的新算法，可在英文维基百科大规模文章中展现层次结构，提高文本分析系统的可靠性。

Feb, 2014

主题模型的网络方法

采用随机块模型方法，针对主题建模中存在的问题，提出了一种更具通用性和原则性的框架，该框架能够自动检测主题数和分级群集单词和文档，从而比 LDA 在统计模型选择方面提供更好的主题模型。

Aug, 2017

信念传播学习主题模型

该研究提出了一种基于马尔可夫随机场框架下的因子图表示方法，实现了传统信念传播算法对隐含狄利克雷分配模型的近似推理和参数估计，该算法在速度和准确性方面均具有竞争力，并且可以成为基于 LDA 的话题模型的通用学习方案。

Sep, 2011

科学的相关主题模型

本文提出了相关话题模型（CTM），通过逻辑正态分布，展现留言比例的相关性，我们还推导出了适用于该模型的快速变分推理算法，并将其应用于 Science 1990-1999 年间发表的文章，数据集包括 57M 词，证明 CTM 比 LDA 拟合效果更好，并将其作为大型文本集成探索性工具。

Aug, 2007

主题模型的平滑和推断

本文探讨了用于高维稀疏计数数据建模的潜在狄利克雷分析或话题模型，比较了多种学习算法，发现主要区别在于应用于计数的平滑量。在优化超参数时，算法性能的差异显著缩小，这使得我们能够选择计算效率高的方法来学习准确的主题模型。

May, 2012

使用深度神经网络从 LDA 模型中学习

本研究提出了一种使用深度神经网络预测 LDA 模型中潜在主题分布的方法，借鉴了迁移学习的思想，实现了在大大降低计算时间的同时取得较好的分类效果。

Aug, 2015

SAP-sLDA：探索非结构化文本的可解释界面

通过低维投影对文本语料库进行探索是一种常见方法，我们提出了一种半监督的人类参与的基于 LDA 的方法，用于学习在低维投影中保留文档之间语义相关性的主题。

Jul, 2023

基于预测限制的抗抑郁药推荐主题模型

本文介绍了一种基于监督信号的议题模型框架，该框架用于训练潜在狄利克雷分配，旨在平衡高维数据的忠实生成解释和相关类标签的准确预测，并将该框架应用于预测抑郁药物使用，相较于传统的监督议题模型和基于高维逻辑回归的药物推荐任务中，本文提出的方法表现更好。

Dec, 2017

随机折叠变分贝叶斯推断用于潜在狄利克雷分配

该研究提出了一种基于折叠变分贝叶斯推断技术的随机算法，能快速准确地从大规模数字文本信息中学习话题模型并与人交互分析。

May, 2013