- AAAI层次主题建模的关联性、合理性和多样性
本文提出了一种基于传输计划和上下文感知的层次主题模型(TraCo),通过传输计划依赖方法和上下文感知的解码器来改善层次主题建模的关联性、合理性和多样性,在基准数据集上的实验证明了该方法的优越性。
- TopicGPT:一种基于提示的主题建模框架
TopicGPT 是一种基于提示的框架,利用大型语言模型 (LLMs) 在提供的文本集合中揭示潜在主题,其主题与人类分类更吻合,并且更易于解释,同时还具有高度适应性,可以在不需要重新训练模型的情况下指定约束条件和修改主题。TopicGPT - 面向社交媒体用户的主题引导自我介绍生成
该研究提出了一个基于 Twitter 数据集的自我介绍文本自动生成方法,利用一个新的基于主题模型的编码器 - 解码器框架,生成用户自我介绍文本并提高了解码结果的质量。
- 在多维连续特征空间中寻找判别性词语
使用单词特征向量以及无监督学习,提取文档中的独立特征词,构建文档特征向量,并在文本分类任务中证明了该方法的有效性。
- ACL利用越词素引导的主题发现
本研究提出了一种基于先前工作的推导来获取主题的方法,结合了语言模型的先验知识和语料库的局部语义,实现了对不在字典中的种子词进行主题推导,并通过三个真实数据集的实验验证了该方法的有效性。
- EMNLP话语结构中的潜在主题和语篇共同作用:谁回应了谁
本研究旨在探索话语连贯中回应关系的一般性结构,并提出一种学习潜在议题和话语结构的模型,通过利用主题一致性和话语依存来预测发起 - 回应联系,实验结果表明,我们的模型在中文客服对话等任务上表现显著优于之前的方法。
- EMNLP循环一致性对抗训练的神经主题建模
该研究提出了一种使用循环一致对抗训练的话题建模方法,能够发现连贯的话题和根据文档标签发现话题,并在无监督 / 有监督主题建模和文本分类中实现更好的效果。
- 主题扩充生成器用于抽象化摘要
该研究提出了一种新的解码器,通过条件调整文本和文档的潜在主题来生成摘要,使用 LDA 等主题模型揭示了更多的全局语义信息,使解码器能够访问文本语料库级别的词共现统计信息,实验表明,与现有模型相比,该方法能显著提高 ROUGE 分数。
- AAAITopicEq:科技文本联合主题与数学方程模型
该研究提出了一种新的主题模型,通过生成数学公式和周围的文本,有效地捕捉了主题与数学之间的关系,可用于主题感知公式生成、公式主题推断和主题感知数学符号与文本的对齐。
- 对抗神经主题模型
提出了基于生成对抗网络的话题模型,称为 Adversarial-neural Topic Model(ATM)。ATM 可以在生成语义话题的同时,生成单词级别的语义表示,并成功应用于开放领域事件提取。
- SIGIR联合学习词嵌入和潜在主题
该研究提出了一个名为 STE 的框架,可以以统一的方式学习词嵌入和潜在主题,从而解决多义问题,并在有效且高效的方式下生成有用的主题特定的词嵌入和连贯的潜在主题。
- TopicRNN: 一种具有长程语义依赖的循环神经网络
本文提出了基于 TopicRNN 的语言模型,它结合了 RNN 和潜在主题模型的优点,能够捕捉本地(句法)和全局(语义)依赖关系,并更好地预测单词。实证结果表明,TopicRNN 在单词预测方面优于现有的上下文 RNN 基线,并且可以作为无 - 多模式贝叶斯嵌入:学习社交知识图谱
本研究探讨在线社交网络与开放知识库之间的联系,提出一种基于多模态贝叶斯嵌入模型的算法 GenVector,通过学习潜在话题和生成单词和网络嵌入来将两种不同的数据形式,在共享潜在话题空间中表示。在三个数据集上的实验表明,该算法明显优于现有方法 - 概率式框架归纳
本文提出了第一个基于概率的帧感应方法,它将框架、事件、参与者作为潜在主题,学习最能解释文本的框架和事件转换。通过句法分析的新型应用进行了框架的推断。在从文本到诱导的框架和提取的事实的端到端评估中,我们的方法产生了最先进的结果,同时大大减少了 - 连续时间动态主题模型
本文介绍了一种新的连续时间动态主题模型(cDTM),它使用布朗运动模拟文档序列中的潜在主题,通过稀疏观测值使用变分推理算法进行有效推断。我们在两个新闻语料库上测试了该模型,并通过预测困惑度和时间戳预测等指标进行了评估。
- 面向不对齐文本的多语言主题模型
该研究开发了多语言主题模型(MuTo)来分析两种语言的文档,其使用随机 EM 来发现匹配语言和多语言潜在主题,因此能够发现真实世界中的共享主题,而无需仔细策划平行语料库,并允许广泛应用主题模型规范的应用于更广泛的语料库类别。
- 主题建模的估计和选择
通过非标准的参数化最大后验概率估计,基于块对角矩阵逼近提出了一种基于似然函数的模型选择方法,同时辅以残差离散度估计来度量模型的拟合程度,并提供了实例来说明模型选择和与标准技术的比较。