GINopic:基于图同构网络的主题建模
本文介绍了一种名为 Graph Topic Model (GTM) 的基于图形神经网络 (GNNs) 的神经主题模型,通过信息交互捕捉图形节点之间的关系,将文档和词汇转化成为图中的节点,并根据共现性连接,通过图卷积汇聚邻居节点信息从而通过共享单词在文档之间建立关系,扩充了文档的主题的表达方式。研究者还基于三个数据集开展了广泛的实验,其结果证明了这种方法的有效性。
Sep, 2020
本文提出了一种名为图向话题(G2T)的框架,该框架能够使用预训练语言模型获取文档表示,并通过语义图和社区检测等方法进行主题建模。自动评估结果表明,G2T 在英文和中文文档上均取得了最优表现,并且比基线模型产生了更好的可解释性和覆盖范围。
Apr, 2023
我们提出了一种基于聚类的主题建模方法,使用概念实体作为语言无关的表示,并使用图神经网络从百科全书语料库和知识库中提取实体的向量表示,该方法在连贯性度量方面始终优于其他主题模型。
Jan, 2023
图形语言模型(GLM)集成了线性文本模型(LM)和图神经网络(GNN)的优点,同时减轻它们的弱点,在有监督和零样本情况下,在概念网络的关系分类任务上超过了基于 LM 和 GNN 的基线。
Jan, 2024
TopicGPT 是一种基于提示的框架,利用大型语言模型 (LLMs) 在提供的文本集合中揭示潜在主题,其主题与人类分类更吻合,并且更易于解释,同时还具有高度适应性,可以在不需要重新训练模型的情况下指定约束条件和修改主题。TopicGPT 通过简化获得高质量且易于解释的主题,代表了一种引人注目的以人为中心的主题建模方法。
Nov, 2023
本文提出了一种基于图的对比学习方法,使用生成的正负样本和原型来改善学习文档主题表示和潜在主题。通过对几个基准数据集的实验,证明了该方法在主题连贯性和文档表示学习方面的有效性。
Jul, 2023
本文提出了一种高斯混合神经主题模型(GMNTM),该模型将单词的顺序和句子的语义意义同时纳入了主题建模,实验结果表明,相比现有的主题建模方法,GMNTM 在困惑度、检索准确性和分类准确性方面获得了显著的改进。
Feb, 2015
Topology-Informed Graph Transformer (TIGT) enhances discriminative power in detecting graph isomorphisms and overall performance of Graph Transformers, outperforming previous models in classifying isomorphism classes of graphs and across various benchmark datasets.
Feb, 2024
本文介绍了关于主题模型的研究,探讨了如何将 contextual embeddings 应用于 neural topic models,以提高主题模型的准确性和一致性,并且研究结果表明,对自然语言处理模型的改进将会对主题模型产生积极影响。
Apr, 2020