SAMSum Corpus: 一个人工标注的对话文本数据集用于提取式摘要

Nov, 2019

SAMSum Corpus: 一个人工标注的对话文本数据集用于提取式摘要

SAMSum Corpus: A Human-annotated Dialogue Dataset for Abstractive Summarization

Bogdan Gliwa, Iwona Mochol, Maciej Biesek, Aleksander Wawer

TL;DR本研究介绍了 SAMSum 语料库，这是一个新的抽象对话摘要数据集，研究人员使用多个模型进行测试，并将其结果与新闻文章语料库的结果进行比较，结果显示与人类评估者的判断相反，模型生成的对话摘要具有更高的 ROUGE 分数，这表明需要使用专用模型和非标准质量度量的抽象对话摘要这一具有挑战性的任务，据我们所知，这是引入高质量聊天对话语料库的第一次尝试，并手动注释了抽象摘要，可供研究人员进行进一步研究。

Abstract

This paper introduces the samsum corpus, a new dataset with abstractive dialogue summaries. We investigate the challenges it poses for automated summarization by testing several models and comparing their results with those obtained on a corpus of news articles. We show that model-gene

samsum corpus abstractive dialogue summaries automated summarization rouge scores chat-dialogues corpus

发现论文，激发创造

MediaSum：面向对话摘要的大规模媒体采访数据集

介绍了一个名叫 MediaSum 的大规模媒体采访数据集，包含 463.6K 份采访文本和摘要，被用于探究电视和广播采访文本的独特位置偏差以及转移学习在改进对话摘要模型上的应用。

Mar, 2021

基于异构图网络的常识知识引入抽象对话摘要

该论文介绍了一种新型的多说话者对话摘要生成器，利用大规模的常识知识来促进对话理解和总结生成。实验表明我们的模型能够优化 SAMSum 数据集，并且也能够更好地适用于新领域的零样本实验。

Oct, 2020

DialogSum：一个真实场景下的对话摘要数据集

提出了 DialogSum，一种大规模标注的对话摘要数据集，通过对该数据集使用最先进的神经摘要器进行经验分析，结果表明对话摘要中存在诸如口语术语、特殊话语结构、代词和省略、语用学和社会常识等独特挑战，需要特定的表示学习技术来更好地处理。

May, 2021

GUMSum：英文抽象摘要的多语种数据和评估

本文提出了 GUMSum 数据集，旨在评估抽象概括的英语摘要。该数据集高度约束，注重替换潜力、事实和忠实度，结果显示 GPT3 达到了令人印象深刻的得分，但仍然表现不如人类，并且不同类型的错误揭示了生成好概括的挑战。

Jun, 2023

ConvoSumm: 对话摘要基准以及通过论证挖掘改进的抽象式摘要

本研究通过设计 Annotation Protocols 并使用 Argument Mining 技术，基于网络上不同形式的讨论为标准数据集，比较了各种先进的对话总结模型，在自动和人工评估中均取得了较高的结果。

Jun, 2021

CADS: 抽象对话概括的挑战的系统文献综述

通过系统性地回顾 2019 年至 2024 年间发表的 1262 篇独特研究论文，本文总结了基于 Transformer 的英语对话抽象总结的研究，并涵盖了对话总结中的主要挑战和相应的技术，例如基于图的方法、额外的训练任务和计划策略。虽然一些挑战，如语言，已经取得了相当大的进展，但其他一些挑战，如理解、准确性和显著性，仍然困难，具有重要的研究机会。

Jun, 2024

TWEETSUMM -- 面向客服的对话摘要数据集

这篇论文介绍了一种自动化客服聊天总结的方法，其中利用了一个大规模的客户支持对话总结数据集和一种针对对话的无监督式提取性总结方法。

Nov, 2021

人在环节下的抽象式对话摘要

本文提出引入不同层次的人类反馈，结合增强学习以提高抽象对话摘要的质量。实验表明，该方法在人类判断方面优于监督式基线，并能提高摘要质量。

Dec, 2022

具有草图监督的可控抽象对话摘要

本文针对抽象对话摘要的质量和粒度控制问题，提出了一种包含两个主要组成部分和阶段的模型，实现了基于伪标注疑问代词类别和基于组成句法分析提取关键词短语生成初步摘要，并通过自动确定或控制源文本中不同文本片段预测和突出显示给定对话的生成摘要句子数量。在最大的对话摘要语料库 SAMSum 上表现出优越性能，达到了 50.79 的 ROUGE-L 评分，并展示了竞争性高的人类评估结果和可控制的效果。

May, 2021

具有对话结构的多视角序列到序列模型用于摘要对话总结

本研究提出了一种多视角序列到序列模型，其通过提取来自不同视角的非结构化日常聊天中的会话结构来表示会话，然后利用多视角解码器来合并不同视角生成对话摘要，在大规模对话摘要语料库上的实验结果表明，本研究方法在自动评估和人类判断方面均明显优于之前的最新模型。

Oct, 2020