利用图形提高抽象多文档摘要
本文提出了一种神经多文档自动摘要(MDS)系统,该系统采用句子关系图,利用图卷积网络(GCN)在关系图上执行多层次传播,从而生成高层次的句子特征并进行重要性评估,然后采用贪婪启发式方法提取显著句子。通过在 DUC 2004 上的实验,证明了结合句子关系和深度神经网络表征的优势。该模型优于传统的基于图的提取式方法和不包含图的基础 GRU 序列模型,并且在多文档自动摘要系统方面表现出了竞争力。
Jun, 2017
本文提出了一种名为 SgSum 的新型 EMDS 框架,将 MDS 任务作为一个子图选择问题,通过构建关系图来选择一个显著的子图,而不是单独评分和提取句子,从而解决了现有方法中忽略句子关系和整个摘要连贯性和凝练性的问题。与传统方法相比,SgSum 模型能够由于模型对句子关系的建模和直接输出更加丰富和连贯的子图形式摘要而获得显著优势,且在 MultiNews 和 DUC 数据集上进行的实验表明,我们的方法比多个强基线模型都有显著改进。
Oct, 2021
本文针对多文档自动摘要问题,提出了一个基于小型多文档训练集的神经抽象模型 fine-tuning 方法,实证结果在两个基准 DUC 数据集上表现优异。
Apr, 2018
HGSUM 是一种多文档摘要模型,其通过使用异构图来表示文档中的不同语义单元(例如单词和句子),并使用图池化进行压缩以保留文档中关键信息和关系。在训练中,HGSUM 使用另一种目标来最大化压缩图与来源自地面真实摘要构建的图之间的相似性,并通过相似性和标准交叉熵目标进行端到端训练,在 MULTI-NEWS、WCEP-100 和 ARXIV 数据集上表现优于现有的多文档摘要模型。
Mar, 2023
本文回顾了近期基于深度学习的多文档摘要模型,提出了新的分类方法以及对这个领域的现状进行了综合总结,并且强调了现有文献中很少讨论的各种目标函数之间的区别,最后对未来发展方向提出了几个建议。
Nov, 2020
本文提出了 KGSum 多文档科学总结的模型,重点在于在编码和解码过程中使用知识图谱来实现内容和关系建模。经验证实验结果显示,相较于基准结果,该架构带来了显著的改进。
Sep, 2022
本文研究了使用引文图来提高科学论文摘要生成的质量,提出了两种方法:为任务提供简单而低成本的多粒度无监督摘要生成方法 (MUS),以及对大量标记数据具有更准确结果的基于图的监督摘要方法 (GSS),并在公共基准数据集上进行了实验验证以证明方法的有效性。
Dec, 2022
本文介绍了首个大规模多文档新闻数据集 Multi-News,并提出一个将传统提取式摘要模型与标准单文档摘要模型结合的端到端模型,取得了有竞争力的结果。我们在 Multi-News 上比较了几种方法,并希望我们的数据和代码能促进多文档摘要领域的进展。
Jun, 2019
本文提出一种通过提取 - 摘要 Transformer 框架解决多文档摘要中输入长度过长问题的方法,其中包括分层提取和摘要重写。通过权重和深度强化学习等机制建立了抽取 - 摘要模型,实现了在大型数据集 Multi-News,Multi-XScience 和 WikiCatSum 上具有最佳效果的模型。
May, 2022