本文通过使用多个 MDS 语料库和一系列最先进的模型来研究这个异构任务,并尝试量化纲要质量并提出考虑制定新 MDS 纲要的要点。此外,我们分析了缺乏在所有语料库上均实现卓越性能的 MDS 系统的原因,并观察到流程度受到系统指标度量的影响,并由于语料库属性而传播偏见。
Oct, 2020
本文回顾了近期基于深度学习的多文档摘要模型,提出了新的分类方法以及对这个领域的现状进行了综合总结,并且强调了现有文献中很少讨论的各种目标函数之间的区别,最后对未来发展方向提出了几个建议。
Nov, 2020
该论文提出了一种基于异构图和神经主题模型的抽象多文档摘要模型,采用图到序列的框架,同时训练主题和摘要模块以提高性能和生成高质量主题。
Oct, 2021
本文介绍了首个大规模多文档新闻数据集 Multi-News,并提出一个将传统提取式摘要模型与标准单文档摘要模型结合的端到端模型,取得了有竞争力的结果。我们在 Multi-News 上比较了几种方法,并希望我们的数据和代码能促进多文档摘要领域的进展。
Jun, 2019
本文研究了 Multi-document summarization (MDS) 在基于开放领域的信息检索下的应用。作者在实验中发现现有的摘要算法性能较低,但通过训练摘要算法可以减少检索错误对算法性能的影响。此外,作者还进行了扰动实验研究了不同类型的文档检索错误对算法影响并提出了实用指南。
Dec, 2022
提出了一种名为 CAST 的归类对齐和稀疏变换器的自动摘要方法,使用 BigSurvey 数据集,将超过 7000 份调查论文的摘要作为目标摘要,430,000 篇参考论文的摘要作为输入文档,赢得了各种高级自动摘要方法的比较实验。
Feb, 2023
我们提出了一种用于摘要生成的检索引导模型,结合了非参数记忆。该模型使用近似最近邻搜索从数据库中检索相关的候选文本,然后利用复制机制和源文档生成摘要。我们在包括科学文章的 MultiXScience 数据集上评估了我们的方法,并讨论了我们的结果和未来工作的可能方向。
Nov, 2023
本文提出了一种解决多文档摘要中忽略文档细节的问题的方法,通过从文档集中解开特定的内容并学习文档的特定表示,将特定信息与文档集表示结合,获得更全面的多文档摘要。
May, 2024
本文提出了一种名为 AQuaMuSe 的可扩展方法,用于自动从问答数据集和大型文档语料库中挖掘基于查询的多文档摘要示例,其中包括种类独特的可提取和抽象式摘要数据集,并提供了详细的数据集评估和基线摘要模型实验。
本文提出了 KGSum 多文档科学总结的模型,重点在于在编码和解码过程中使用知识图谱来实现内容和关系建模。经验证实验结果显示,相较于基准结果,该架构带来了显著的改进。
Sep, 2022