利用引用摘要网络进行科学论文摘要
本论文提出了一种基于引用图的摘要模型 CGSum,相对于基于输入文档内容进行摘要的方法,它可以更好的理解科技论文的含义并产生高质量的摘要,同时构建了一个包含 141K 篇不同领域的科技论文的数据集 Semantic Scholar Network(SSN),这个数据集构成了一个大型的连接引用图。研究结果表明,引用图对于理解论文内容并产生高质量的摘要十分关键。
Apr, 2021
该论文提出了一种新的解决方案,通过开发和发布一个大规模的、手动注释的科学论文语料库,并提出了将作者的原始亮点(摘要)和文章对社区的实际影响(引用)整合的摘要方法,创建全面的、混合型摘要。我们进行了实验,证明了我们的语料库在训练数据驱动模型的科学论文摘要中的功效以及我们的混合型摘要优于摘要和传统的基于引用的摘要。这个大规模的注释语料库和混合方法提供了一个新的科学论文摘要研究框架。
Sep, 2019
提出一种新的上下文化摘要方法,该方法可以根据含有引用文献的句子(称为 “引文”)生成信息丰富的摘要,概述了引文相关引用位置的文献内容,该方法提取和建模论文的引文,检索相关的引用文献段落,并生成针对每个引文的抽象摘要。
Nov, 2023
提出一种利用引文语境和文章话语模型的科技论文摘要方法,通过为每个引文提供上下文来克服引文标题与文章内容不一致的问题,同时借助文章的话语特征来产生更好的摘要。对 TAC2014 科技论文摘要数据集的结果表明,该方法实现了超过 30% 的性能提升,适用于其他领域。
Apr, 2017
使用文献计量学文本挖掘和摘要技术对科学文献进行自动生成,利用引文生成摘要,通过 C-LexRank 对单篇文章进行摘要提取,同时拓展到一系列科学文献的摘要提取和分析,证明引文是创建摘要的一种独特信息资源。
Feb, 2014
通过组织少数非母语英语者编写计算机视觉会议论文摘要来缓解研究人员特别是非母语人士面临的科学文献调研问题,总结分析 2019 年和 2020 年顶尖的计算机视觉会议上 2000 篇论文的选题方式和范围,实验结果表明可以在不涉及与其兴趣无关的论文的前提下总结广泛的论文。
Mar, 2022
本文研究了使用引文图来提高科学论文摘要生成的质量,提出了两种方法:为任务提供简单而低成本的多粒度无监督摘要生成方法 (MUS),以及对大量标记数据具有更准确结果的基于图的监督摘要方法 (GSS),并在公共基准数据集上进行了实验验证以证明方法的有效性。
Dec, 2022
通过整合源文章中引用的外部论文,本研究旨在提高语言模型在生物医学抽象摘要中的表现。我们提出了一种基于注意力的引文聚合模型,该模型整合了引文论文中的领域特定知识,使神经网络能够利用论文内容和引文论文的相关知识来生成摘要。此外,我们构建并发布了一个大规模的生物医学摘要数据集,为我们的研究奠定了基础。广泛的实验表明,我们的模型优于现有方法,在生物医学抽象文本摘要中取得了显著的改进。
Oct, 2023
本文介绍了一种新的数据集,用于总结计算机科学出版物,展示了利用神经句子编码和传统的总结功能来开发模型的方式,并表明即使在传统的科学领域中,对句子的编码以及他们的本地和全局背景进行编码的模型也有很好的性能,并实现了明显优于已经建立的基准方法的结果。
Jun, 2017
提出了一种使用分布式单词表示和领域知识从参考论文中提取适当上下文的无监督模型,评估结果表明其明显优于现有技术,并且还演示了上下文化方法提高科学文章引用摘要的有效性。
May, 2017