人机交互主题检测与跟踪的主题时间热度图
开发了一种新型交互式人机协同的主题建模系统,支持对语料库特定方面的主题建模,具有易于使用的界面、记录与比较功能以及主题词推荐功能,经过多次用户研究验证,该系统在主题建模中的应用具有显著价值。
Apr, 2023
我们提出了一种名为 “协调主题建模” 的新问题,旨在通过复用现有知识来更加可解释地表示语料库,并设计了一种基于嵌入式的协调主题模型(ECTM),该模型通过引入主题和文档级别的监督和自训练机制来解决此问题,并在多个领域进行的广泛实验表明我们的模型优于其他基线。
Oct, 2022
本文介绍了一种新的连续时间动态主题模型(cDTM),它使用布朗运动模拟文档序列中的潜在主题,通过稀疏观测值使用变分推理算法进行有效推断。我们在两个新闻语料库上测试了该模型,并通过预测困惑度和时间戳预测等指标进行了评估。
Jun, 2012
本文提出了关键词辅助嵌入式主题模型(KeyETM),它使嵌入式主题模型(ETM)得以利用用户先前领域知识中的信息,从而在量化指标和主题干扰任务的实验中展现了优秀的表现,而不仅仅是将话题模型作为无监督模型。
Nov, 2021
本文提出了一种新的任务,中间级别的重要事件检测,旨在从新闻语料库中检测在特定时间 / 位置发生的关键事件,并聚焦于相同的主题。为了解决这些挑战,我们开发了一个无监督的重要事件检测框架 EvMine,它提取时间频繁的 peak 短语,通过从我们设计的 peak 短语图中检测社区将 peak 短语合并成事件相关的特征集,使用从事件相关特征集自动生成的伪标签训练分类器,并利用检索到的文档迭代检测到的关键事件。
Jun, 2022
提出了一种新的查询驱动主题模型,可以允许用户指定一个简单的查询,并返回相关的主题,从而避免了领域专家的繁琐工作。实验结果表明,该模型相比于传统和神经主题模型更加有效。
May, 2021
本文提出了无限动态主题模型 (iDTM),该模型能够适应文档集合中主题数量、主题分布和流行度等潜在结构的时空演化,使用该模型对 NIPS 社区中的主题进行了分析并在模拟和真实数据集上进行了评估,结果良好。
Mar, 2012
通过为神经主题模型添加一种直观的交互方式,即用户可以为主题标记一个词语,并更新主题词使其靠近标记词,从而允许用户根据信息需求优化主题,我们的研究方法通过人机研究评估,证明用户标记能够改善文件排序得分,帮助找到更相关的文档。
Nov, 2023
通过比较 LDA 和社区检测算法的优缺点,该研究提出一种用于主题发现的新算法,可在英文维基百科大规模文章中展现层次结构,提高文本分析系统的可靠性。
Feb, 2014