利用图形提高抽象多文档摘要

ACLMay, 2020

Leveraging Graph to Improve Abstractive Multi-Document Summarization

Wei Li, Xinyan Xiao, Jiachen Liu, Hua Wu, Haifeng Wang...

TL;DR本文提出了一种神经抽象的文档多摘要模型，该模型利用文档之间的相似性图和话语图等知名图形表示来更有效地处理多个输入文档并生成抽象的摘要，其利用图形编码文档以捕捉跨文档关系，可以利用图形来指导摘要生成过程，结果表明该架构相比多个强基线带来了实质性的改进。

Abstract

graphs that capture relations between textual units have great benefits for detecting salient information from multiple documents and generating overall coherent summaries. In this paper, we develop a neural abstractive

graphs multi-document summarization neural abstractive model document relations pre-trained language models

发现论文，激发创造

主题引导的抽象多文档摘要

该论文提出了一种基于异构图和神经主题模型的抽象多文档摘要模型，采用图到序列的框架，同时训练主题和摘要模块以提高性能和生成高质量主题。

Oct, 2021

基于图神经网络的多文档摘要

本文提出了一种神经多文档自动摘要（MDS）系统，该系统采用句子关系图，利用图卷积网络（GCN）在关系图上执行多层次传播，从而生成高层次的句子特征并进行重要性评估，然后采用贪婪启发式方法提取显著句子。通过在 DUC 2004 上的实验，证明了结合句子关系和深度神经网络表征的优势。该模型优于传统的基于图的提取式方法和不包含图的基础 GRU 序列模型，并且在多文档自动摘要系统方面表现出了竞争力。

Jun, 2017

SgSum: 将多文档摘要转换为子图选择

本文提出了一种名为 SgSum 的新型 EMDS 框架，将 MDS 任务作为一个子图选择问题，通过构建关系图来选择一个显著的子图，而不是单独评分和提取句子，从而解决了现有方法中忽略句子关系和整个摘要连贯性和凝练性的问题。与传统方法相比，SgSum 模型能够由于模型对句子关系的建模和直接输出更加丰富和连贯的子图形式摘要而获得显著优势，且在 MultiNews 和 DUC 数据集上进行的实验表明，我们的方法比多个强基线模型都有显著改进。

Oct, 2021

基于神经网络的抽象式多文档摘要生成方法研究

本文针对多文档自动摘要问题，提出了一个基于小型多文档训练集的神经抽象模型 fine-tuning 方法，实证结果在两个基准 DUC 数据集上表现优异。

Apr, 2018

用于抽象式多文档摘要的压缩异构图

HGSUM 是一种多文档摘要模型，其通过使用异构图来表示文档中的不同语义单元（例如单词和句子），并使用图池化进行压缩以保留文档中关键信息和关系。在训练中，HGSUM 使用另一种目标来最大化压缩图与来源自地面真实摘要构建的图之间的相似性，并通过相似性和标准交叉熵目标进行端到端训练，在 MULTI-NEWS、WCEP-100 和 ARXIV 数据集上表现优于现有的多文档摘要模型。

Mar, 2023

深度学习技术在多文档摘要中的应用：一项调查

本文回顾了近期基于深度学习的多文档摘要模型，提出了新的分类方法以及对这个领域的现状进行了综合总结，并且强调了现有文献中很少讨论的各种目标函数之间的区别，最后对未来发展方向提出了几个建议。

Nov, 2020

基于知识图谱中心视角的多文档科学摘要

本文提出了 KGSum 多文档科学总结的模型，重点在于在编码和解码过程中使用知识图谱来实现内容和关系建模。经验证实验结果显示，相较于基准结果，该架构带来了显著的改进。

Sep, 2022

引用图增强的科学论文摘要提取

本文研究了使用引文图来提高科学论文摘要生成的质量，提出了两种方法：为任务提供简单而低成本的多粒度无监督摘要生成方法 (MUS)，以及对大量标记数据具有更准确结果的基于图的监督摘要方法 (GSS)，并在公共基准数据集上进行了实验验证以证明方法的有效性。

Dec, 2022

Multi-News：一个大规模的多文档摘要数据集和抽象分层模型

本文介绍了首个大规模多文档新闻数据集 Multi-News，并提出一个将传统提取式摘要模型与标准单文档摘要模型结合的端到端模型，取得了有竞争力的结果。我们在 Multi-News 上比较了几种方法，并希望我们的数据和代码能促进多文档摘要领域的进展。

Jun, 2019

通过参考灵活提取和信用感知来提高多文档摘要

本文提出一种通过提取 - 摘要 Transformer 框架解决多文档摘要中输入长度过长问题的方法，其中包括分层提取和摘要重写。通过权重和深度强化学习等机制建立了抽取 - 摘要模型，实现了在大型数据集 Multi-News，Multi-XScience 和 WikiCatSum 上具有最佳效果的模型。

May, 2022