SciSummPip: 一种无监督的科学论文摘要生成管道

Oct, 2020

SciSummPip: 一种无监督的科学论文摘要生成管道

SciSummPip: An Unsupervised Scientific Paper Summarization Pipeline

Jiaxin Ju, Ming Liu, Longxiang Gao, Shirui Pan

TL;DR本文介绍了我们的文本摘要系统 SciSummPip，它受到 SummPip 的启发，包括 SciBERT、PageRank 和语言信息，它与之前的方法不同之处在于适应了科学领域的内容选择和摘要长度约束，并在培训集和盲测集上证明了方法的有效性。

Abstract

The scholarly document processing (SDP) workshop is to encourage more efforts on natural language understanding of scientific task. It contains three shared tasks and we participate in the LongSumm shared task. In this paper, we describe our →

scholarly document processing text summarization system scisummpip content selection scientific domain

发现论文，激发创造

无监督多文档摘要生成及句子图压缩技术

该研究提出了一种基于 unsupervised 方法的 SummPip，通过将原始文档转换成语句图，并考虑语言和深度表示，然后应用谱聚类来获得多个句子簇，并最终压缩每个簇以生成最终摘要。实验表明我们的方法可以与先前的无监督方法相竞争，并且甚至可以与神经监督方法相媲美。此外，人类评估显示我们的系统与人类编写的摘要相比是一致而完整的。

Jul, 2020

Summaformers @ LaySumm 20, LongSumm 20

本文探讨了利用 Transformer-based 系统概括多领域科学研究论文的问题，并设计了两种不同类型的概述手段，即 LaySumm 和 LongSumm，使用 ROUGE 指标有效评估了本文系统的优越性。

Jan, 2021

SciBERTSUM: 面向科学文档的提取式摘要

SciBERTSUM 是一种针对科学论文的摘要框架，通过增加节嵌入层和应用稀疏注意力机制，在长文本（超过 500 句）中表现出更好的 ROUGE 分数。

Jan, 2022

SKT5SciSumm - 一种多文档科学摘要的混合生成方法

SKT5SciSumm 是一个混合框架，利用 SPECTER 对文本句子进行编码和表示，使用 k-means 聚类进行提取式摘要，利用 T5 系列模型生成抽象总结，从而在科学文本的多文档摘要任务上取得了最新的成果。

Feb, 2024

CL-SciSumm 2018 共享任务：结果与关键见解

CL-SciSumm Shared Task 2018 was held as part of SIGIR's Annual Conference, which focused on scientific document summarization in the computational linguistics domain, evaluated using two metrics and providing datasets for the community.

Sep, 2019

TalkSumm: 基于学术会议演讲的科学论文摘要数据集和可扩展标注方法

本文提出了一种利用科学会议上的演讲视频自动生成科技论文摘要的新方法，通过收集 1716 篇论文及其对应的视频，并创建了一个摘要数据集，最终模型在该数据集上的表现与手动摘要数据集上的模型相当，并通过人工专家验证了自动生成摘要的质量。

Jun, 2019

长篇科学文档的基于话语的无监督摘要

本文提出了一种基于无监督的基于图的排名模型，用于提取科学文献的摘要。我们的方法假定源文档采用两级分层图表示，并利用不对称的位置提示来确定句子的重要性。在 PubMed 和 arXiv 数据集上的结果表明，我们的方法在自动指标和人工评价方面优于强无监督基线。此外，其性能与许多基于监督学习的方法相当。这些结果表明，篇章结构中的模式是确定科学文章重要性的强有力信号。

May, 2020

CL-SciSumm 共享任务 2019 概述与结果

该论文介绍了 2019 年 CL-SciSumm 共享任务，包括三个任务：确定引用文献与被引用文献间的关系，分类表述要素和生成概括性摘要等，使用 40 个带有注释的 CL-SciSumm 2018 语料库和 1000 个来自 SciSummNet 数据集的引用和参考文献，以及使用了两种评估指标，其中 ROUGE 作为一种评估指标。

Jul, 2019

SciLit: 一种联合科学文献发现、摘要和引用生成平台

SciLit 是一个自动推荐相关论文、提取摘要、建议引文的流水线，可提供文学发现和科学写作的辅助工具。

Jun, 2023

GLIMPSE: 学术评论的实用多文档摘要

提出了一种旨在提供学术评论综述的简明方法，该方法通过引入新颖的唯一性评分来提取评论中相关的句子，从而提供一个全面而平衡的观点，并在人类评估中显示出比基准方法更有区别性的摘要，并在自动评价指标方面具有可比较的性能。

Jun, 2024