主题建模与深度神经网络：一项调查

Feb, 2021

主题建模与深度神经网络：一项调查

Topic Modelling Meets Deep Neural Networks: A Survey

He Zhao, Dinh Phung, Viet Huynh, Yuan Jin, Lan Du...

TL;DR本文介绍了神经主题模型研究的最新进展和发展方向，旨在为 AI 社区中的研究人员提供一个全面的概述以促进其在这一快速发展研究领域中进行创新。

Abstract

topic modelling has been a successful technique for text analysis for almost twenty years. When topic modelling met deep neural networks,

topic modelling deep neural networks neural topic models text generation language models

发现论文，激发创造

神经主题模型综述：方法、应用和挑战

综述了神经主题模型（Neural Topic Models）的方法、应用和挑战，将当前的神经主题模型方法按网络结构进行系统分类，并介绍了在短文本和跨语言文档等多种场景中的神经主题模型应用。还讨论了基于神经主题模型构建的各种热门应用，最后指出了神经主题模型面临的挑战，以激发未来的研究。

Jan, 2024

重访主题指导语言模型

一项最近的自然语言处理研究旨在结合语言模型和主题模型，这些主题引导的语言模型通过将主题模型与神经语言模型相结合，采用无监督学习方法来发现文档级别的词汇使用模式。本文比较了这些方法在标准化环境中的效果，并发现这些方法中没有任何一种超越了标准 LSTM 语言模型基准，并且大多数方法无法学习到好的主题。此外，我们训练了一个探测神经语言模型的方法，结果显示基准模型的隐藏状态已经编码了主题信息。本研究公开了所使用的所有代码。

Dec, 2023

基于深度学习的文本摘要综述

近年来，深度学习通过能够学习语言数据的复杂表示方式从而在自然语言处理中带来了革命性的变化，深度学习模型广泛应用于提升多种自然语言处理任务的性能。本文综述了近年来流行的文本摘要任务，包括抽取式、生成式、多文档等，并讨论了相关的深度学习模型以及其在这些任务上的实验结果，同时涵盖了摘要任务的数据集和数据表示，以及与之相关的机遇和挑战，旨在激发未来的研究努力以进一步推动该领域的发展。研究目标在于解释这些方法在其需求上的不同之处，因为对它们的理解对于选择适用于特定环境的技术至关重要。

Oct, 2023

神经动态聚焦主题模型

本文提出了一种基于神经组态推断的动态聚焦主题模型，该模型能够跟踪主题的出现情况以及活跃度，并在各种任务中实现了比其他主题模型更好的泛化能力和类似的预测能力。

Jan, 2023

神经多模态主题建模：全面评估

本文提出了首次系统全面评估多模式主题建模的方法，并提出了两个新的主题建模解决方案和两个新的评估指标。通过对数据集的评估，我们发现我们的模型都能生成连贯且多样化的主题。然而，一个方法优于另一个方法的程度取决于评估指标和数据集的组合，这表明未来需要进一步探索混合解决方案。值得注意的是，我们简明的人工评估与我们提出的评估指标结果一致，这不仅强化了评估指标的可信度，也突出了其在引导未来多模式主题建模研究中的潜力。

Mar, 2024

文本摘要的系统调查：从统计方法到大型语言模型

通过深度神经网络、预训练语言模型和最新的大型语言模型的出现，文本摘要研究经历了几次重大转型，本文综述通过这些范式转变的视角全面回顾了文本摘要研究的进展和演变，分为两个主要部分：(1) 在大型语言模型时代之前的数据集、评估指标和摘要方法的详细概述，包括传统统计方法、深度学习方法和预训练语言模型微调技术，以及 (2) 大型语言模型时代中对基准测试、建模和评估摘要的最新进展的首次详细研究。通过综合现有文献并提供一个连贯的概述，本文还讨论了研究趋势、面临的挑战以及在摘要研究中提出的有希望的研究方向，旨在引导研究人员了解摘要研究的不断演变的领域。

Jun, 2024

基于神经网络的摘要生成方法调研

本文综述了近期在基于神经网络的自动文本摘要中的十种最先进的神经网络模型，其中包括五种生成式模型和五种抽取式模型，并讨论了应用于摘要任务的相关技术和未来研究的有前途的方向。

Mar, 2018

神经机器翻译深度学习技术综述

这份文献调查追溯了神经机器翻译的起源和主要发展时间线，探究了重要的分支，对不同的研究方向进行分类，并讨论了该领域的一些未来研究趋势。

Feb, 2020

TopicAdapt - 一种企业间主题自适应方法

该论文介绍了一种神经主题模型 TopicAdapt，可以从一个相关的源语料库中适应相关主题，并在目标语料库中发现源语料库中缺失的新主题，实验结果表明，该模型在多个领域的多个数据集上表现优于现有的主题模型。

Oct, 2023

主题标签的自动生成

本文提出了一种基于序列到序列神经网络的方法，用于为主题生成描述性标签，同时使用合成的数据集进行训练和测试，并通过与人工标注的标签进行比较评估该方法。

May, 2020