GINopic：基于图同构网络的主题建模

ACLApr, 2024

GINopic：基于图同构网络的主题建模

GINopic: Topic Modeling with Graph Isomorphism Network

Suman Adhya, Debarshi Kumar Sanyal

TL;DR通过使用基于图同构网络的 GINopic 主题建模框架，我们展示了其相对现有主题模型的有效性，并突出了其推进主题建模的潜力。

Abstract

topic modeling is a widely used approach for analyzing and exploring large document collections. Recent research efforts have incorporated pre-trained contextualized language models, such as BERT embeddings, into

topic modeling contextualized language models ginopic graph isomorphism networks advancing topic modeling

发现论文，激发创造

融合文档关系图的神经主题建模

本文介绍了一种名为 Graph Topic Model (GTM) 的基于图形神经网络 (GNNs) 的神经主题模型，通过信息交互捕捉图形节点之间的关系，将文档和词汇转化成为图中的节点，并根据共现性连接，通过图卷积汇聚邻居节点信息从而通过共享单词在文档之间建立关系，扩充了文档的主题的表达方式。研究者还基于三个数据集开展了广泛的实验，其结果证明了这种方法的有效性。

Sep, 2020

G2T：基于预训练语言模型和社区检测的主题建模简单通用框架

本文提出了一种名为图向话题（G2T）的框架，该框架能够使用预训练语言模型获取文档表示，并通过语义图和社区检测等方法进行主题建模。自动评估结果表明，G2T 在英文和中文文档上均取得了最优表现，并且比基线模型产生了更好的可解释性和覆盖范围。

Apr, 2023

话题作为实体聚类：基于语言模型和图神经网络的基于实体的话题

我们提出了一种基于聚类的主题建模方法，使用概念实体作为语言无关的表示，并使用图神经网络从百科全书语料库和知识库中提取实体的向量表示，该方法在连贯性度量方面始终优于其他主题模型。

Jan, 2023

动态交互主题表示

GPTopic 是一个利用大型语言模型创建动态、交互式主题表示的软件包，为用户提供直观的聊天界面，使主题建模更加易于访问和全面。

Mar, 2024

图形语言模型

图形语言模型（GLM）集成了线性文本模型（LM）和图神经网络（GNN）的优点，同时减轻它们的弱点，在有监督和零样本情况下，在概念网络的关系分类任务上超过了基于 LM 和 GNN 的基线。

Jan, 2024

TopicGPT：一种基于提示的主题建模框架

TopicGPT 是一种基于提示的框架，利用大型语言模型 (LLMs) 在提供的文本集合中揭示潜在主题，其主题与人类分类更吻合，并且更易于解释，同时还具有高度适应性，可以在不需要重新训练模型的情况下指定约束条件和修改主题。TopicGPT 通过简化获得高质量且易于解释的主题，代表了一种引人注目的以人为中心的主题建模方法。

Nov, 2023

图形对比主题模型

本文提出了一种基于图的对比学习方法，使用生成的正负样本和原型来改善学习文档主题表示和潜在主题。通过对几个基准数据集的实验，证明了该方法在主题连贯性和文档表示学习方面的有效性。

Jul, 2023

具有排序敏感性和语义感知能力的主题建模

本文提出了一种高斯混合神经主题模型（GMNTM），该模型将单词的顺序和句子的语义意义同时纳入了主题建模，实验结果表明，相比现有的主题建模方法，GMNTM 在困惑度、检索准确性和分类准确性方面获得了显著的改进。

Feb, 2015

基于拓扑的图转换器

Topology-Informed Graph Transformer (TIGT) enhances discriminative power in detecting graph isomorphisms and overall performance of Graph Transformers, outperforming previous models in classifying isomorphism classes of graphs and across various benchmark datasets.

Feb, 2024

预训练是热门话题：上下文化文档嵌入提高了主题相关性

本文介绍了关于主题模型的研究，探讨了如何将 contextual embeddings 应用于 neural topic models，以提高主题模型的准确性和一致性，并且研究结果表明，对自然语言处理模型的改进将会对主题模型产生积极影响。

Apr, 2020