引用图增强的科学论文摘要提取

Dec, 2022

Scientific Paper Extractive Summarization Enhanced by Citation Graphs

Xiuying Chen, Mingzhe Li, Shen Gao, Rui Yan, Xin Gao...

TL;DR本文研究了使用引文图来提高科学论文摘要生成的质量，提出了两种方法：为任务提供简单而低成本的多粒度无监督摘要生成方法 (MUS)，以及对大量标记数据具有更准确结果的基于图的监督摘要方法 (GSS)，并在公共基准数据集上进行了实验验证以证明方法的有效性。

Abstract

In a citation graph, adjacent paper nodes share related scientific terms and topics. The graph thus conveys unique structure information of document-level relatedness that can be utilized in the paper summarization

citation graph summarization multi-granularity unsupervised summarization graph-based supervised summarization scientific papers

发现论文，激发创造

引用图增强科学论文摘要

本论文提出了一种基于引用图的摘要模型 CGSum，相对于基于输入文档内容进行摘要的方法，它可以更好的理解科技论文的含义并产生高质量的摘要，同时构建了一个包含 141K 篇不同领域的科技论文的数据集 Semantic Scholar Network（SSN），这个数据集构成了一个大型的连接引用图。研究结果表明，引用图对于理解论文内容并产生高质量的摘要十分关键。

Apr, 2021

利用图形提高抽象多文档摘要

本文提出了一种神经抽象的文档多摘要模型，该模型利用文档之间的相似性图和话语图等知名图形表示来更有效地处理多个输入文档并生成抽象的摘要，其利用图形编码文档以捕捉跨文档关系，可以利用图形来指导摘要生成过程，结果表明该架构相比多个强基线带来了实质性的改进。

May, 2020

长篇科学文档的基于话语的无监督摘要

本文提出了一种基于无监督的基于图的排名模型，用于提取科学文献的摘要。我们的方法假定源文档采用两级分层图表示，并利用不对称的位置提示来确定句子的重要性。在 PubMed 和 arXiv 数据集上的结果表明，我们的方法在自动指标和人工评价方面优于强无监督基线。此外，其性能与许多基于监督学习的方法相当。这些结果表明，篇章结构中的模式是确定科学文章重要性的强有力信号。

May, 2020

面向抽取式文本摘要的多路复用图神经网络

我们提出了一种 Multi-GCN 模型来解决文本摘要中的问题，该模型结合了句子和词语之间的不同类型关系，并根据此模型提出了一个 Multi-GraS 模型进行提取性文本摘要。

Aug, 2021

利用主题感知图神经网络增强抽取式文本摘要

本文提出了基于图神经网络（GNN）的抽取式摘要模型，并整合了深度神经主题模型（NTM）来发现潜在主题，从而提供句子选择的文档级特征，实验结果表明，我们的模型在 CNN/DM 和 NYT 数据集上取得了最先进的结果，在由较长文档组成的科学论文数据集上也明显优于现有方法，进一步研究表明，主题信息可以帮助模型从整个文档中预先选择凸显内容，因此能够有效地摘要长文档。

Oct, 2020

异质图神经网络用于文档摘要提取

本文介绍了一种异构图神经网络 (HeterSumGraph) 用于信息抽取式文档摘要的任务中，该网络结构包含不同粒度级别的语义节点，这些额外的节点作为句子之间的中介，丰富交叉句关系，同时我们的图结构在自然扩展从单个文档设置到多文档，引入文档节点。该方法是第一次在基于图的神经网络中引入不同类型的节点进行信息抽取式文档摘要，并进行了全面的定性分析以探究其优劣。

Apr, 2020

基于图神经网络的多文档摘要

本文提出了一种神经多文档自动摘要（MDS）系统，该系统采用句子关系图，利用图卷积网络（GCN）在关系图上执行多层次传播，从而生成高层次的句子特征并进行重要性评估，然后采用贪婪启发式方法提取显著句子。通过在 DUC 2004 上的实验，证明了结合句子关系和深度神经网络表征的优势。该模型优于传统的基于图的提取式方法和不包含图的基础 GRU 序列模型，并且在多文档自动摘要系统方面表现出了竞争力。

Jun, 2017

基于查询的多文档摘要：将新颖主题模型与基于图的半监督学习相结合

通过引入句子层级和主题层级的图半监督学习方法，以及利用句子和词之间的依赖关系构建主题模型，可以有效改善查询聚焦的多文档摘要的质量。经实验证明，该方法在 DUC 和 TAC 数据集上非常有效。

Dec, 2012

SgSum: 将多文档摘要转换为子图选择

本文提出了一种名为 SgSum 的新型 EMDS 框架，将 MDS 任务作为一个子图选择问题，通过构建关系图来选择一个显著的子图，而不是单独评分和提取句子，从而解决了现有方法中忽略句子关系和整个摘要连贯性和凝练性的问题。与传统方法相比，SgSum 模型能够由于模型对句子关系的建模和直接输出更加丰富和连贯的子图形式摘要而获得显著优势，且在 MultiNews 和 DUC 数据集上进行的实验表明，我们的方法比多个强基线模型都有显著改进。

Oct, 2021

由潜在分层文档结构引导的抽象摘要

提出使用层次感知图神经网络（HierGNN）实现文档结构层次分析的自动摘要模型，在 CNN / DM 和 XSum 数据集上分别取得了平均 ROUGE-1/2/L 为 0.55 和 0.75，在人工评估中也证明了其比基线具有更高的内容相关性和较少的冗余。

Nov, 2022