抽象多文档摘要中的特异性解析

May, 2024

Disentangling Specificity for Abstractive Multi-document Summarization

Congbo Ma, Wei Emma Zhang, Hu Wang, Haojie Zhuang, Mingyu Guo

TL;DR本文提出了一种解决多文档摘要中忽略文档细节的问题的方法，通过从文档集中解开特定的内容并学习文档的特定表示，将特定信息与文档集表示结合，获得更全面的多文档摘要。

Abstract

multi-document summarization (MDS) generates a summary from a document set. Each document in a set describes topic-relevant concepts, while per document also has its unique contents. However, the document specifi

multi-document summarization specific content document set document-specific representations comprehensive solution

发现论文，激发创造

主题引导的抽象多文档摘要

该论文提出了一种基于异构图和神经主题模型的抽象多文档摘要模型，采用图到序列的框架，同时训练主题和摘要模块以提高性能和生成高质量主题。

Oct, 2021

多篇文档摘要如何 “多”?

本文介绍一种用于评估多文档摘要生成模型及数据集中数据分散程度的自动化度量方法，并检验几个流行的多文档摘要数据集，结果表明某些数据集没有利用多文档信息，提出应用该度量方法评估数据集和模型的性能。

Oct, 2022

深度学习技术在多文档摘要中的应用：一项调查

本文回顾了近期基于深度学习的多文档摘要模型，提出了新的分类方法以及对这个领域的现状进行了综合总结，并且强调了现有文献中很少讨论的各种目标函数之间的区别，最后对未来发展方向提出了几个建议。

Nov, 2020

多文档摘要中的语料库评估和系统偏差检测

本文通过使用多个 MDS 语料库和一系列最先进的模型来研究这个异构任务，并尝试量化纲要质量并提出考虑制定新 MDS 纲要的要点。此外，我们分析了缺乏在所有语料库上均实现卓越性能的 MDS 系统的原因，并观察到流程度受到系统指标度量的影响，并由于语料库属性而传播偏见。

Oct, 2020

探索开放领域多文档摘要的挑战

本文研究了 Multi-document summarization (MDS) 在基于开放领域的信息检索下的应用。作者在实验中发现现有的摘要算法性能较低，但通过训练摘要算法可以减少检索错误对算法性能的影响。此外，作者还进行了扰动实验研究了不同类型的文档检索错误对算法影响并提出了实用指南。

Dec, 2022

哪些信息起作用？通过部分信息分解解析人类编写的多文档摘要

通过部分信息分解的方法，我们对人工撰写的摘要进行了特征化，发现源文件的数量与其对摘要的贡献存在直接依赖关系。

May, 2024

基于知识图谱中心视角的多文档科学摘要

本文提出了 KGSum 多文档科学总结的模型，重点在于在编码和解码过程中使用知识图谱来实现内容和关系建模。经验证实验结果显示，相较于基准结果，该架构带来了显著的改进。

Sep, 2022

从多个文档中挖掘共性和特异性用于多文档摘要

本文提出了一种基于文档层次聚类的多文档自动摘要方法，通过提取反映所有文档共性和部分子类特异性的句子生成摘要，从而满足多文档摘要的覆盖和多样性要求。在 DUC'2002-2004 和 Multi-News 数据集上的实验证明了该方法的有效性。

Mar, 2023

利用图形提高抽象多文档摘要

本文提出了一种神经抽象的文档多摘要模型，该模型利用文档之间的相似性图和话语图等知名图形表示来更有效地处理多个输入文档并生成抽象的摘要，其利用图形编码文档以捕捉跨文档关系，可以利用图形来指导摘要生成过程，结果表明该架构相比多个强基线带来了实质性的改进。

May, 2020

Multi-News：一个大规模的多文档摘要数据集和抽象分层模型

本文介绍了首个大规模多文档新闻数据集 Multi-News，并提出一个将传统提取式摘要模型与标准单文档摘要模型结合的端到端模型，取得了有竞争力的结果。我们在 Multi-News 上比较了几种方法，并希望我们的数据和代码能促进多文档摘要领域的进展。

Jun, 2019