监督式主题模型
提出了一种名为 ECA 的学习流程,基于低阶矩的光谱分解,它可以恢复多种混合模型的参数,并在仅使用三元统计时正确恢复主题概率向量和主题优先级,因此具有可扩展性。
Apr, 2012
通过比较 LDA 和社区检测算法的优缺点,该研究提出一种用于主题发现的新算法,可在英文维基百科大规模文章中展现层次结构,提高文本分析系统的可靠性。
Feb, 2014
采用随机块模型方法,针对主题建模中存在的问题,提出了一种更具通用性和原则性的框架,该框架能够自动检测主题数和分级群集单词和文档,从而比 LDA 在统计模型选择方面提供更好的主题模型。
Aug, 2017
该研究提出了一种基于马尔可夫随机场框架下的因子图表示方法,实现了传统信念传播算法对隐含狄利克雷分配模型的近似推理和参数估计,该算法在速度和准确性方面均具有竞争力,并且可以成为基于 LDA 的话题模型的通用学习方案。
Sep, 2011
本文提出了相关话题模型(CTM),通过逻辑正态分布,展现留言比例的相关性,我们还推导出了适用于该模型的快速变分推理算法,并将其应用于 Science 1990-1999 年间发表的文章,数据集包括 57M 词,证明 CTM 比 LDA 拟合效果更好,并将其作为大型文本集成探索性工具。
Aug, 2007
本文探讨了用于高维稀疏计数数据建模的潜在狄利克雷分析或话题模型,比较了多种学习算法,发现主要区别在于应用于计数的平滑量。在优化超参数时,算法性能的差异显著缩小,这使得我们能够选择计算效率高的方法来学习准确的主题模型。
May, 2012
本研究提出了一种使用深度神经网络预测 LDA 模型中潜在主题分布的方法,借鉴了迁移学习的思想,实现了在大大降低计算时间的同时取得较好的分类效果。
Aug, 2015
通过低维投影对文本语料库进行探索是一种常见方法,我们提出了一种半监督的人类参与的基于 LDA 的方法,用于学习在低维投影中保留文档之间语义相关性的主题。
Jul, 2023
本文介绍了一种基于监督信号的议题模型框架,该框架用于训练潜在狄利克雷分配,旨在平衡高维数据的忠实生成解释和相关类标签的准确预测,并将该框架应用于预测抑郁药物使用,相较于传统的监督议题模型和基于高维逻辑回归的药物推荐任务中,本文提出的方法表现更好。
Dec, 2017