- EMNLP言论决定你的本质:引导评价性话题用于个性分析
研究表明,人类的行为和个性中表达对实体和概念的态度或立场是不可或缺的。本文提出了评估主题的概念,该主题通过将主题模型应用于社交媒体上的评估文本来获得。评估主题与个体文本作者联系起来,建立他们的评估资料。本文将评估配置文件应用于 Reddit - AAAI神经动态聚焦主题模型
本文提出了一种基于神经组态推断的动态聚焦主题模型,该模型能够跟踪主题的出现情况以及活跃度,并在各种任务中实现了比其他主题模型更好的泛化能力和类似的预测能力。
- 通过无限潜在状态复制改进主题模型推断
本文提出了一种基于无限潜在状态复制(ILR)的新型推理方法,旨在改善用于主题建模中的 CGS 推理。实验结果表明,与 CGS 推理相比,ILR 在现有主题模型的推理方面表现更出色。
- 话题作为实体聚类:基于语言模型和图神经网络的基于实体的话题
我们提出了一种基于聚类的主题建模方法,使用概念实体作为语言无关的表示,并使用图神经网络从百科全书语料库和知识库中提取实体的向量表示,该方法在连贯性度量方面始终优于其他主题模型。
- ACL超越词汇列表:面向科技文档的抽象主题标签
本研究通过抽象式的多文档摘要(MDS)将生成人类般的主题标签作为替代方案,此外结合聚类和摘要来评估主题模型,以理解需要进一步研究才能实现 MDS 主题标签功能,同时提出了改进 MDS 的思路。
- EMNLP神经主题模型失效了吗?
针对自动化与人工对主题模型的评估之间的关系进行研究,分析了两个与主题模型相关的方面,即它们的稳定性和是否能够与人工确定的分类相匹配,发现神经主题模型在稳定性和对人工分类相匹配方面表现不佳,并通过演示一种简单的集成方法来解决这两个问题。
- ProSiT!使用渐进相似度阈值进行潜变量发现
提出了一种比主题模型和聚类方法更灵活、确定性和解释性更好的方法 PROgressive SImilarity Thresholds(ProSiT),它可以自动找到最佳的潜在维度,并在四个基准数据集上成功地证明了它的效果。
- ACL利用越词素引导的主题发现
本研究提出了一种基于先前工作的推导来获取主题的方法,结合了语言模型的先验知识和语料库的局部语义,实现了对不在字典中的种子词进行主题推导,并通过三个真实数据集的实验验证了该方法的有效性。
- ACL半监督神经主题建模的联合学习方法
本文介绍了标签索引神经主题模型(LI-NTM),它是迄今为止首个有效的上游半监督神经主题模型,并通过文档重建基准测试发现 LI-NTM 在低标记数据制度和带有信息标签的数据集中优于现有神经主题模型,此外,通过消融研究发现,我们共同学习的分类 - BERTopic: 一种基于类别的 TF-IDF 过程的神经主题建模方法
BERTopic 是一种主题模型,通过 BERT 语言模型生成文档嵌入,并利用 TF-IDF 进行聚类和生成主题,具有较高的性能。
- 一个配置支配全局?使用多目标贝叶斯优化实现主题模型中的超参数传递
本文探讨了使用多目标超参数优化方法,优化三种知名主题模型时需要考虑到主题连贯性和多样性这两种冲突的目标,并且发现选择超参数时,训练语料库的特征至关重要,表明可以在数据集间传输最优的超参数配置。
- WWW预训练语言模型表示的潜空间聚类进行主题发现
本文提出了一种基于 PLM 嵌入的联合潜在空间学习和聚类框架,通过联合建模主题 - 单词和文档 - 主题分布,有效地利用 PLMs 在主题发现方面的强大表示能力和出色语言特征,并在两个基准数据集上生成了比强劲的主题模型更加连贯、多样的主题, - WSDM关键词辅助的嵌入式主题模型
本文提出了关键词辅助嵌入式主题模型(KeyETM),它使嵌入式主题模型(ETM)得以利用用户先前领域知识中的信息,从而在量化指标和主题干扰任务的实验中展现了优秀的表现,而不仅仅是将话题模型作为无监督模型。
- 主题建模的少样本学习
本文提出了一种基于神经网络的少样本学习方法,该方法可以从少量文档中学习主题模型,并通过 EM 算法的先验概率对主题模型参数进行估计,通过随机梯度下降方法使测试似然性达到最大值,在实验中,我们证明了该方法在三个真实文档集上表现出比现有方法更好 - MM探究虚假新闻中的主题连贯性
本研究使用主题模型分析跨领域新闻的相关性,实验证明虚假新闻在开头句子和其余部分之间存在较大的主题偏离。
- ACLTAN-NTM:用于神经主题建模的主题注意力网络
提出了一种名为 TAN-NTM 的框架,该框架使用一种新颖的注意力机制,即关注主题相关线索的单词,将文档作为一个标记序列进行处理。该模型发现,利用主题 - 单词分布来学习更好的特征已经没有得到很好的利用,尝试提出一种提高这种探讨的框架。在 - EMNLP使用知识蒸馏改进神经主题模型
使用知识蒸馏将概率主题模型和预训练转换器的最佳属性结合起来,以提高主题质量和性能。
- 图结构主题神经网络
本文提出了 GraphSTONE,一种基于 GCN 模型的结构话题神经网络,利用图的主题模型,从概率角度捕获广泛的指示性图结构。同时,通过设计多视图 GCN 统一节点特征和结构主题特征,并利用结构主题来指导聚合,从而达到高效和可解释性。
- ICML可解释的、话语主题感知的神经语言理解
该研究介绍了一种将主题模型与语言模型相结合的方法,扩展了语言理解的范围,通过主题进行了文档级上下文的抽取,并提出了一种可解释的主题表征,将主题语义加入到语言模型中。通过建模每个句子中的话题,保留了句子与文档主题关联,提出了一种既有隐藏话题, - EMNLP厌倦主题模型?预训练词嵌入聚类同样适用于快速且良好的主题!
本文提出了一种利用预训练单词嵌入进行文本聚类的新方法,同时整合文本信息进行加权聚类并重新排名前几个单词,旨在挖掘出文档集合中的主题,并对其性能进行基准测试并分析其在降维中的性能。实验表明,所提出的方法在降低时间和计算复杂度同时不输于传统的概