基于知识图谱中心视角的多文档科学摘要

HGSUM 是一种多文档摘要模型，其通过使用异构图来表示文档中的不同语义单元（例如单词和句子），并使用图池化进行压缩以保留文档中关键信息和关系。在训练中，HGSUM 使用另一种目标来最大化压缩图与来源自地面真实摘要构建的图之间的相似性，并通过相似性和标准交叉熵目标进行端到端训练，在 MULTI-NEWS、WCEP-100 和 ARXIV 数据集上表现优于现有的多文档摘要模型。

Mar, 2023

SgSum: 将多文档摘要转换为子图选择

本文提出了一种名为 SgSum 的新型 EMDS 框架，将 MDS 任务作为一个子图选择问题，通过构建关系图来选择一个显著的子图，而不是单独评分和提取句子，从而解决了现有方法中忽略句子关系和整个摘要连贯性和凝练性的问题。与传统方法相比，SgSum 模型能够由于模型对句子关系的建模和直接输出更加丰富和连贯的子图形式摘要而获得显著优势，且在 MultiNews 和 DUC 数据集上进行的实验表明，我们的方法比多个强基线模型都有显著改进。

Oct, 2021

SKT5SciSumm - 一种多文档科学摘要的混合生成方法

SKT5SciSumm 是一个混合框架，利用 SPECTER 对文本句子进行编码和表示，使用 k-means 聚类进行提取式摘要，利用 T5 系列模型生成抽象总结，从而在科学文本的多文档摘要任务上取得了最新的成果。

Feb, 2024

多篇文档摘要如何 “多”?

本文介绍一种用于评估多文档摘要生成模型及数据集中数据分散程度的自动化度量方法，并检验几个流行的多文档摘要数据集，结果表明某些数据集没有利用多文档信息，提出应用该度量方法评估数据集和模型的性能。

Oct, 2022

基于图神经网络的多文档摘要

本文提出了一种神经多文档自动摘要（MDS）系统，该系统采用句子关系图，利用图卷积网络（GCN）在关系图上执行多层次传播，从而生成高层次的句子特征并进行重要性评估，然后采用贪婪启发式方法提取显著句子。通过在 DUC 2004 上的实验，证明了结合句子关系和深度神经网络表征的优势。该模型优于传统的基于图的提取式方法和不包含图的基础 GRU 序列模型，并且在多文档自动摘要系统方面表现出了竞争力。

Jun, 2017

非参数记忆引导的多文档摘要

我们提出了一种用于摘要生成的检索引导模型，结合了非参数记忆。该模型使用近似最近邻搜索从数据库中检索相关的候选文本，然后利用复制机制和源文档生成摘要。我们在包括科学文章的 MultiXScience 数据集上评估了我们的方法，并讨论了我们的结果和未来工作的可能方向。

Nov, 2023

探索多篇文档的层次关系总结

本文介绍 PeerSum 数据集以生成高度抽象的科学论文审稿的 meta-reviews，并介绍了 Rammer 模型来通过稀疏注意力机制预测元数据特征，从而提高多文档摘要系统的能力。

May, 2023