抽象文本摘要：现状、挑战与改进

Sep, 2024

抽象文本摘要：现状、挑战与改进

Abstractive Text Summarization: State of the Art, Challenges, and Improvements

Hassan Shakil, Ahmad Farooq, Jugal Kalita

TL;DR本研究聚焦于抽象文本摘要领域，系统综述了当前技术、存在的挑战和未来研究方向。通过详细比较传统序列到序列模型、预训练大语言模型及其他方法，提出了有效解决方案，旨在为研究人员提供一个结构化的视角，以推动抽象摘要研究的发展。

Abstract

Specifically focusing on the landscape of abstractive text summarization, as opposed to extractive Techniques, this survey presents a comprehensive overview, delving into state-of-the-art Techniques, prevailing <

发现论文，激发创造

自动文档摘要的词语和短语对齐

本文主要探讨了目前单文档自动摘要所采用的句子提取和基于词袋模型的标题生成算法的不足，并提出了一种基于词语和短语对齐技术的自动化摘要算法。通过实验结果表明，该模型能够在<文档，摘要>数据集中可靠地识别单词和短语的对齐。

Jul, 2009

文本摘要中的抽象化改进

提出使用上下文相关网络和预训练的语言模型来提高抽象文本摘要的生成水平和使用新颖度度量来优化生成的摘要，从而实现比现有方法更高水平的摘要生成。

Aug, 2018

长文档摘要的实证调查：数据集、模型和度量

本综述论文系统性地评估了长文档自动摘要各主要组成部分的研究进展，包括基准数据集、摘要模型和评估方法，并提出未来工作的方向。

Jul, 2022

摘要现状

本文旨在简明扼要地阐述抽象文本摘要现状，强调需采用预训练编码器-解码器模型与大型自回归语言模型。此外，讨论了摘要系统评估的挑战和用于零-shot摘要的instruction tuned模型的潜力，最后概述了如何将摘要系统整合到商业应用中。

May, 2023

C2F-FAR 与 ChatGPT 构建的混合式长文本摘要：一项实证研究

本文介绍了一个使用 ChatGPT 和 C2F-FAR 提出的混合抽取和摘要文本的流程，可以用于长篇文章和书籍。机器生成的摘要可以与人工摘要在自动化评估指标下表现得一样好，但在文本连贯性、忠实度和风格等方面仍存在问题。因此，我们认为 ChatGPT 还不够成熟。这项工作为 NLP 研究人员提供了有关 ChatGPT 在文本摘要方面的能力与实践需求的重要信息，促进进一步研究。

Jun, 2023

领域特定抽象摘要的挑战及其克服方法

本文讨论大型语言模型在特定领域摘要文本生成中的局限性，特别指出了基于Transformer的模型复杂度与模型崩溃的问题，并探讨了解决现有研究中存在的问题的相关技术。

Jul, 2023

大语言模型的文本摘要：MPT-7b-instruct、Falcon-7b-instruct和OpenAI Chat-GPT模型的比较研究

这篇研究论文使用了各种不同的大型语言模型，包括MPT-7b-instruct，falcon-7b-instruct和OpenAI ChatGPT text-davinci-003模型，通过不同的超参数对生成的摘要进行评估，并发现text-davinci-003模型的表现优于其他模型。该研究还分析了CNN Daily Mail和XSum两个不同的数据集，旨在提供对大型语言模型在不同数据集上应用时性能的全面理解。这项工作为对NLP领域的研究人员和从业者提供了有价值的见解，同时也为开发应对各种业务挑战的高级生成式人工智能应用奠定了基础。

Oct, 2023

可控文本摘要：挑战、方法和前景的揭示 -- 一项综述

总结特定用户的需要和意图，关注于开发更贴合特定目标和用户需求的文本摘要方法。最近的学术关注点转向了更可控的摘要方法的发展，但缺乏全面的调查来深入探索在这一背景下所使用的各种可控性方面或属性，并研究现有的解决方案。在本调查中，我们形式化了可控文本摘要任务，根据它们的共享特征和目标将可控性方面进行分类，并对每个类别中的现有方法和数据集进行了全面的研究。此外，根据我们的调查结果，我们发现了一些限制和研究空白，同时也探讨了CTS的潜在解决方案和未来发展方向。

Nov, 2023

改进序列到序列模型，使用元启发式方法进行抽象文本摘要

在信息时代，人们阅读冗长的新闻文章的时间越来越少，提供简洁的信息摘要变得比以往任何时候都更为重要。本文旨在改进现有的架构和模型，针对抽象文本摘要进行微调超参数，并尝试特定的编码器-解码器组合，以提高摘要生成的效果。

Mar, 2024

文本摘要的系统调查：从统计方法到大型语言模型

通过深度神经网络、预训练语言模型和最新的大型语言模型的出现，文本摘要研究经历了几次重大转型，本文综述通过这些范式转变的视角全面回顾了文本摘要研究的进展和演变，分为两个主要部分：(1)在大型语言模型时代之前的数据集、评估指标和摘要方法的详细概述，包括传统统计方法、深度学习方法和预训练语言模型微调技术，以及(2)大型语言模型时代中对基准测试、建模和评估摘要的最新进展的首次详细研究。通过综合现有文献并提供一个连贯的概述，本文还讨论了研究趋势、面临的挑战以及在摘要研究中提出的有希望的研究方向，旨在引导研究人员了解摘要研究的不断演变的领域。

Jun, 2024