SciSummPip: 一种无监督的科学论文摘要生成管道
该研究提出了一种基于 unsupervised 方法的 SummPip,通过将原始文档转换成语句图,并考虑语言和深度表示,然后应用谱聚类来获得多个句子簇,并最终压缩每个簇以生成最终摘要。实验表明我们的方法可以与先前的无监督方法相竞争,并且甚至可以与神经监督方法相媲美。此外,人类评估显示我们的系统与人类编写的摘要相比是一致而完整的。
Jul, 2020
本文探讨了利用 Transformer-based 系统概括多领域科学研究论文的问题,并设计了两种不同类型的概述手段,即 LaySumm 和 LongSumm,使用 ROUGE 指标有效评估了本文系统的优越性。
Jan, 2021
SciBERTSUM 是一种针对科学论文的摘要框架,通过增加节嵌入层和应用稀疏注意力机制,在长文本(超过 500 句)中表现出更好的 ROUGE 分数。
Jan, 2022
SKT5SciSumm 是一个混合框架,利用 SPECTER 对文本句子进行编码和表示,使用 k-means 聚类进行提取式摘要,利用 T5 系列模型生成抽象总结,从而在科学文本的多文档摘要任务上取得了最新的成果。
Feb, 2024
CL-SciSumm Shared Task 2018 was held as part of SIGIR's Annual Conference, which focused on scientific document summarization in the computational linguistics domain, evaluated using two metrics and providing datasets for the community.
Sep, 2019
本文提出了一种利用科学会议上的演讲视频自动生成科技论文摘要的新方法,通过收集 1716 篇论文及其对应的视频,并创建了一个摘要数据集,最终模型在该数据集上的表现与手动摘要数据集上的模型相当,并通过人工专家验证了自动生成摘要的质量。
Jun, 2019
本文提出了一种基于无监督的基于图的排名模型,用于提取科学文献的摘要。我们的方法假定源文档采用两级分层图表示,并利用不对称的位置提示来确定句子的重要性。在 PubMed 和 arXiv 数据集上的结果表明,我们的方法在自动指标和人工评价方面优于强无监督基线。此外,其性能与许多基于监督学习的方法相当。这些结果表明,篇章结构中的模式是确定科学文章重要性的强有力信号。
May, 2020
该论文介绍了 2019 年 CL-SciSumm 共享任务,包括三个任务:确定引用文献与被引用文献间的关系,分类表述要素和生成概括性摘要等,使用 40 个带有注释的 CL-SciSumm 2018 语料库和 1000 个来自 SciSummNet 数据集的引用和参考文献,以及使用了两种评估指标,其中 ROUGE 作为一种评估指标。
Jul, 2019
提出了一种旨在提供学术评论综述的简明方法,该方法通过引入新颖的唯一性评分来提取评论中相关的句子,从而提供一个全面而平衡的观点,并在人类评估中显示出比基准方法更有区别性的摘要,并在自动评价指标方面具有可比较的性能。
Jun, 2024