关键词辅助的嵌入式主题模型
该研究采用动态主题模型和词嵌入模型组合设计了一种动态嵌入主题模型,通过向每个时间步长中的嵌入表示赋值主题,该模型能够学习到平滑的主题轨迹,并在三个不同的语料库上发现,在文档完成任务中,该模型优于动态 LDA,而且比 LDA 更易于训练。
Jul, 2019
本研究提出了一种新的主题模型,嵌入式主题模型(ETM),通过将传统的主题模型与词嵌入技术相结合,成功发现了即使在包含生僻词和停用词的大词汇表中也具有可解释性的主题。此外,研究还开发了高效的变分推理算法来拟合 ETM 进行预测。
Jul, 2019
本篇论文介绍了一种基于词向量和马尔科夫随机场正则化模型的主题模型,从而改进对小文本数据的话题推断。结果表明,与传统主题模型相比,改进后的方法可以更有效地对短文本数据进行话题建模。
Sep, 2016
基于软聚类和文档嵌入的模糊主题建模对比传统的 Latent Dirichlet Allocation(LDA)模型,在新闻发布监测中,得到了更加自然的结果。
Sep, 2023
通过为神经主题模型添加一种直观的交互方式,即用户可以为主题标记一个词语,并更新主题词使其靠近标记词,从而允许用户根据信息需求优化主题,我们的研究方法通过人机研究评估,证明用户标记能够改善文件排序得分,帮助找到更相关的文档。
Nov, 2023
采用随机块模型方法,针对主题建模中存在的问题,提出了一种更具通用性和原则性的框架,该框架能够自动检测主题数和分级群集单词和文档,从而比 LDA 在统计模型选择方面提供更好的主题模型。
Aug, 2017
EdTM is a label name supervised topic modeling approach that incorporates analysts' understanding of the corpus using LM/LLM based document-topic affinities and optimal transport for making globally coherent topic assignments.
Jun, 2024
本研究旨在探讨大型语言模型(LLMs)在主题提取方面的潜力,并建立评估协议以评估 LLMs 的聚类效果。通过深入实验与评估,总结了采用 LLMs 进行主题提取的优势和限制。
Mar, 2024