引用图增强的科学论文摘要提取
本论文提出了一种基于引用图的摘要模型 CGSum,相对于基于输入文档内容进行摘要的方法,它可以更好的理解科技论文的含义并产生高质量的摘要,同时构建了一个包含 141K 篇不同领域的科技论文的数据集 Semantic Scholar Network(SSN),这个数据集构成了一个大型的连接引用图。研究结果表明,引用图对于理解论文内容并产生高质量的摘要十分关键。
Apr, 2021
本文提出了一种神经抽象的文档多摘要模型,该模型利用文档之间的相似性图和话语图等知名图形表示来更有效地处理多个输入文档并生成抽象的摘要,其利用图形编码文档以捕捉跨文档关系,可以利用图形来指导摘要生成过程,结果表明该架构相比多个强基线带来了实质性的改进。
May, 2020
本文提出了一种基于无监督的基于图的排名模型,用于提取科学文献的摘要。我们的方法假定源文档采用两级分层图表示,并利用不对称的位置提示来确定句子的重要性。在 PubMed 和 arXiv 数据集上的结果表明,我们的方法在自动指标和人工评价方面优于强无监督基线。此外,其性能与许多基于监督学习的方法相当。这些结果表明,篇章结构中的模式是确定科学文章重要性的强有力信号。
May, 2020
我们提出了一种 Multi-GCN 模型来解决文本摘要中的问题,该模型结合了句子和词语之间的不同类型关系,并根据此模型提出了一个 Multi-GraS 模型进行提取性文本摘要。
Aug, 2021
本文提出了基于图神经网络(GNN)的抽取式摘要模型,并整合了深度神经主题模型(NTM)来发现潜在主题,从而提供句子选择的文档级特征,实验结果表明,我们的模型在 CNN/DM 和 NYT 数据集上取得了最先进的结果,在由较长文档组成的科学论文数据集上也明显优于现有方法,进一步研究表明,主题信息可以帮助模型从整个文档中预先选择凸显内容,因此能够有效地摘要长文档。
Oct, 2020
本文介绍了一种异构图神经网络 (HeterSumGraph) 用于信息抽取式文档摘要的任务中,该网络结构包含不同粒度级别的语义节点,这些额外的节点作为句子之间的中介,丰富交叉句关系,同时我们的图结构在自然扩展从单个文档设置到 多文档,引入文档节点。该方法是第一次在基于图的神经网络中引入不同类型的节点进行信息抽取式文档摘要,并进行了全面的定性分析以探究其优劣。
Apr, 2020
本文提出了一种神经多文档自动摘要(MDS)系统,该系统采用句子关系图,利用图卷积网络(GCN)在关系图上执行多层次传播,从而生成高层次的句子特征并进行重要性评估,然后采用贪婪启发式方法提取显著句子。通过在 DUC 2004 上的实验,证明了结合句子关系和深度神经网络表征的优势。该模型优于传统的基于图的提取式方法和不包含图的基础 GRU 序列模型,并且在多文档自动摘要系统方面表现出了竞争力。
Jun, 2017
通过引入句子层级和主题层级的图半监督学习方法,以及利用句子和词之间的依赖关系构建主题模型,可以有效改善查询聚焦的多文档摘要的质量。经实验证明,该方法在 DUC 和 TAC 数据集上非常有效。
Dec, 2012
本文提出了一种名为 SgSum 的新型 EMDS 框架,将 MDS 任务作为一个子图选择问题,通过构建关系图来选择一个显著的子图,而不是单独评分和提取句子,从而解决了现有方法中忽略句子关系和整个摘要连贯性和凝练性的问题。与传统方法相比,SgSum 模型能够由于模型对句子关系的建模和直接输出更加丰富和连贯的子图形式摘要而获得显著优势,且在 MultiNews 和 DUC 数据集上进行的实验表明,我们的方法比多个强基线模型都有显著改进。
Oct, 2021
提出使用层次感知图神经网络(HierGNN)实现文档结构层次分析的自动摘要模型,在 CNN / DM 和 XSum 数据集上分别取得了平均 ROUGE-1/2/L 为 0.55 和 0.75,在人工评估中也证明了其比基线具有更高的内容相关性和较少的冗余。
Nov, 2022