基于读者感知的多文档摘要：增强模型与首个数据集

MMAug, 2017

基于读者感知的多文档摘要：增强模型与首个数据集

Reader-Aware Multi-Document Summarization: An Enhanced Model and The First Dataset

Piji Li, Lidong Bing, Wai Lam

TL;DR本文介绍了一个新的数据集来解决阅读者感知的多文档摘要问题；通过扩展基于变分自动编解码器的 MDS 框架，共同考虑新闻文档和读者评论。实验结果表明，读者评论能够提高摘要的表现，并证明了所提出的数据集的实用性。

Abstract

We investigate the problem of reader-aware multi-document summarization (RA-MDS) and introduce a new dataset for this problem. To tackle RA-MDS, we extend a →

reader-aware multi-document summarization variational auto-encodes news documents reader comments dataset

发现论文，激发创造

基于稀疏编码的阅读者感知型多文档摘要

提出了一种新的 MDS 范例 —— 读者感知式多文档摘要（RA-MDS），通过特定的稀疏编码法联合考虑新闻报道和读者评论来计算文本片段的显著性，并通过实体重写来提高语言质量，进一步探讨了名词 / 动词短语的优化模型支持压缩摘要的生成，该方法在经典和自行采集的数据集上取得了显著的效果

Apr, 2015

Multi-News：一个大规模的多文档摘要数据集和抽象分层模型

本文介绍了首个大规模多文档新闻数据集 Multi-News，并提出一个将传统提取式摘要模型与标准单文档摘要模型结合的端到端模型，取得了有竞争力的结果。我们在 Multi-News 上比较了几种方法，并希望我们的数据和代码能促进多文档摘要领域的进展。

Jun, 2019

AQuaMuSe: 自动为基于查询的多文档摘要生成数据集

本文提出了一种名为 AQuaMuSe 的可扩展方法，用于自动从问答数据集和大型文档语料库中挖掘基于查询的多文档摘要示例，其中包括种类独特的可提取和抽象式摘要数据集，并提供了详细的数据集评估和基线摘要模型实验。

Oct, 2020

探索多篇文档的层次关系总结

本文介绍 PeerSum 数据集以生成高度抽象的科学论文审稿的 meta-reviews，并介绍了 Rammer 模型来通过稀疏注意力机制预测元数据特征，从而提高多文档摘要系统的能力。

May, 2023

生成大量学术论文结构化摘要：数据集和方法

提出了一种名为 CAST 的归类对齐和稀疏变换器的自动摘要方法，使用 BigSurvey 数据集，将超过 7000 份调查论文的摘要作为目标摘要，430,000 篇参考论文的摘要作为输入文档，赢得了各种高级自动摘要方法的比较实验。

Feb, 2023

深度学习技术在多文档摘要中的应用：一项调查

本文回顾了近期基于深度学习的多文档摘要模型，提出了新的分类方法以及对这个领域的现状进行了综合总结，并且强调了现有文献中很少讨论的各种目标函数之间的区别，最后对未来发展方向提出了几个建议。

Nov, 2020

非参数记忆引导的多文档摘要

我们提出了一种用于摘要生成的检索引导模型，结合了非参数记忆。该模型使用近似最近邻搜索从数据库中检索相关的候选文本，然后利用复制机制和源文档生成摘要。我们在包括科学文章的 MultiXScience 数据集上评估了我们的方法，并讨论了我们的结果和未来工作的可能方向。

Nov, 2023

主题引导的抽象多文档摘要

该论文提出了一种基于异构图和神经主题模型的抽象多文档摘要模型，采用图到序列的框架，同时训练主题和摘要模块以提高性能和生成高质量主题。

Oct, 2021

抽象的面向查询的多文档摘要生成的数据增强

该研究介绍了两个 QMDS 训练数据集，这些数据集具有互补的性质并使用新的层次编码器建立了基于端的神经网络模型，这些模型不仅在自动度量上表现出了优异的结果，而且在人类评估中也表现出了优异的结果。

Mar, 2021

多篇文档摘要如何 “多”?

本文介绍一种用于评估多文档摘要生成模型及数据集中数据分散程度的自动化度量方法，并检验几个流行的多文档摘要数据集，结果表明某些数据集没有利用多文档信息，提出应用该度量方法评估数据集和模型的性能。

Oct, 2022