人机交互主题检测与跟踪的主题时间热度图

KDDOct, 2021

人机交互主题检测与跟踪的主题时间热度图

Topic-time Heatmaps for Human-in-the-loop Topic Detection and Tracking

Doug Beeferman, Hang Jiang

TL;DR本文介绍了一种人机交互的 TDT 模型方法，通过生成新闻语料库的可视化概览，用户能够选择感兴趣的区域并回答一系列问题，从而更好地理解不同事件及其共性，从而优化算法

Abstract

The essential task of topic detection and tracking (TDT) is to organize a collection of news media into clusters of stories that pertain to the same real-world event. To apply →

topic detection and tracking tdt models human-in-the-loop method event similarity model news media

发现论文，激发创造

一种以用户为中心，交互式，人机交互主题建模系统

开发了一种新型交互式人机协同的主题建模系统，支持对语料库特定方面的主题建模，具有易于使用的界面、记录与比较功能以及主题词推荐功能，经过多次用户研究验证，该系统在主题建模中的应用具有显著价值。

Apr, 2023

微博事件检测中基于人工智能循环的关键词发现和期望估计方法

本文通过人工智能与人类的互动，迭代地估计关键词的期望，并将关键词和期望用于模型训练，提高了事件检测的准确性和可解释性。

Dec, 2019

协同主题建模

我们提出了一种名为 “协调主题建模” 的新问题，旨在通过复用现有知识来更加可解释地表示语料库，并设计了一种基于嵌入式的协调主题模型（ECTM），该模型通过引入主题和文档级别的监督和自训练机制来解决此问题，并在多个领域进行的广泛实验表明我们的模型优于其他基线。

Oct, 2022

连续时间动态主题模型

本文介绍了一种新的连续时间动态主题模型（cDTM），它使用布朗运动模拟文档序列中的潜在主题，通过稀疏观测值使用变分推理算法进行有效推断。我们在两个新闻语料库上测试了该模型，并通过预测困惑度和时间戳预测等指标进行了评估。

Jun, 2012

关键词辅助的嵌入式主题模型

本文提出了关键词辅助嵌入式主题模型（KeyETM)，它使嵌入式主题模型（ETM）得以利用用户先前领域知识中的信息，从而在量化指标和主题干扰任务的实验中展现了优秀的表现，而不仅仅是将话题模型作为无监督模型。

Nov, 2021

大规模文本语料中的无监督关键事件检测

本文提出了一种新的任务，中间级别的重要事件检测，旨在从新闻语料库中检测在特定时间 / 位置发生的关键事件，并聚焦于相同的主题。为了解决这些挑战，我们开发了一个无监督的重要事件检测框架 EvMine，它提取时间频繁的 peak 短语，通过从我们设计的 peak 短语图中检测社区将 peak 短语合并成事件相关的特征集，使用从事件相关特征集自动生成的伪标签训练分类器，并利用检索到的文档迭代检测到的关键事件。

Jun, 2022

基于查询的主题模型

提出了一种新的查询驱动主题模型，可以允许用户指定一个简单的查询，并返回相关的主题，从而避免了领域专家的繁琐工作。实验结果表明，该模型相比于传统和神经主题模型更加有效。

May, 2021

Timeline：一种动态层级狄利克雷过程模型，用于恢复文本流中主题的出生 / 死亡和演化

本文提出了无限动态主题模型 (iDTM)，该模型能够适应文档集合中主题数量、主题分布和流行度等潜在结构的时空演化，使用该模型对 NIPS 社区中的主题进行了分析并在模拟和真实数据集上进行了评估，结果良好。

Mar, 2012

有标记的交互式主题模型

通过为神经主题模型添加一种直观的交互方式，即用户可以为主题标记一个词语，并更新主题词使其靠近标记词，从而允许用户根据信息需求优化主题，我们的研究方法通过人机研究评估，证明用户标记能够改善文件排序得分，帮助找到更相关的文档。

Nov, 2023

一种高再现性和高准确度的自动化主题分类方法

通过比较 LDA 和社区检测算法的优缺点，该研究提出一种用于主题发现的新算法，可在英文维基百科大规模文章中展现层次结构，提高文本分析系统的可靠性。

Feb, 2014