基于知识图谱中心视角的多文档科学摘要
本文提出了一种神经抽象的文档多摘要模型,该模型利用文档之间的相似性图和话语图等知名图形表示来更有效地处理多个输入文档并生成抽象的摘要,其利用图形编码文档以捕捉跨文档关系,可以利用图形来指导摘要生成过程,结果表明该架构相比多个强基线带来了实质性的改进。
May, 2020
本文回顾了近期基于深度学习的多文档摘要模型,提出了新的分类方法以及对这个领域的现状进行了综合总结,并且强调了现有文献中很少讨论的各种目标函数之间的区别,最后对未来发展方向提出了几个建议。
Nov, 2020
HGSUM 是一种多文档摘要模型,其通过使用异构图来表示文档中的不同语义单元(例如单词和句子),并使用图池化进行压缩以保留文档中关键信息和关系。在训练中,HGSUM 使用另一种目标来最大化压缩图与来源自地面真实摘要构建的图之间的相似性,并通过相似性和标准交叉熵目标进行端到端训练,在 MULTI-NEWS、WCEP-100 和 ARXIV 数据集上表现优于现有的多文档摘要模型。
Mar, 2023
本文提出了一种名为 SgSum 的新型 EMDS 框架,将 MDS 任务作为一个子图选择问题,通过构建关系图来选择一个显著的子图,而不是单独评分和提取句子,从而解决了现有方法中忽略句子关系和整个摘要连贯性和凝练性的问题。与传统方法相比,SgSum 模型能够由于模型对句子关系的建模和直接输出更加丰富和连贯的子图形式摘要而获得显著优势,且在 MultiNews 和 DUC 数据集上进行的实验表明,我们的方法比多个强基线模型都有显著改进。
Oct, 2021
SKT5SciSumm 是一个混合框架,利用 SPECTER 对文本句子进行编码和表示,使用 k-means 聚类进行提取式摘要,利用 T5 系列模型生成抽象总结,从而在科学文本的多文档摘要任务上取得了最新的成果。
Feb, 2024
本文介绍一种用于评估多文档摘要生成模型及数据集中数据分散程度的自动化度量方法,并检验几个流行的多文档摘要数据集,结果表明某些数据集没有利用多文档信息,提出应用该度量方法评估数据集和模型的性能。
Oct, 2022
本文提出了一种神经多文档自动摘要(MDS)系统,该系统采用句子关系图,利用图卷积网络(GCN)在关系图上执行多层次传播,从而生成高层次的句子特征并进行重要性评估,然后采用贪婪启发式方法提取显著句子。通过在 DUC 2004 上的实验,证明了结合句子关系和深度神经网络表征的优势。该模型优于传统的基于图的提取式方法和不包含图的基础 GRU 序列模型,并且在多文档自动摘要系统方面表现出了竞争力。
Jun, 2017
我们提出了一种用于摘要生成的检索引导模型,结合了非参数记忆。该模型使用近似最近邻搜索从数据库中检索相关的候选文本,然后利用复制机制和源文档生成摘要。我们在包括科学文章的 MultiXScience 数据集上评估了我们的方法,并讨论了我们的结果和未来工作的可能方向。
Nov, 2023
本文介绍 PeerSum 数据集以生成高度抽象的科学论文审稿的 meta-reviews,并介绍了 Rammer 模型来通过稀疏注意力机制预测元数据特征,从而提高多文档摘要系统的能力。
May, 2023