对话摘要中省略理解研究

Nov, 2022

Towards Understanding Omission in Dialogue Summarization

Yicheng Zou, Kaitao Song, Xu Tan, Zhongkai Fu, Tao Gui...

TL;DR该论文提出了一个带有省略标签的高质量数据集，用于对话摘要中的省略检测，研究发现，通过提供省略标签，可以实现摘要模型中省略信息的恢复，从而显著提高摘要质量，因此提出一个省略检测任务，基于该数据集支持该任务的训练和评估，同时呼吁基于该数据集进行的省略检测研究。

Abstract

dialogue summarization aims to condense the lengthy dialogue into a concise summary, and has recently achieved significant progress. However, the result of existing methods is still far from satisfactory. Previous works indicated that →

发现论文，激发创造

SAMSum Corpus:一个人工标注的对话文本数据集用于提取式摘要

本研究介绍了SAMSum语料库，这是一个新的抽象对话摘要数据集，研究人员使用多个模型进行测试，并将其结果与新闻文章语料库的结果进行比较，结果显示与人类评估者的判断相反，模型生成的对话摘要具有更高的ROUGE分数，这表明需要使用专用模型和非标准质量度量的抽象对话摘要这一具有挑战性的任务，据我们所知，这是引入高质量聊天对话语料库的第一次尝试，并手动注释了抽象摘要，可供研究人员进行进一步研究。

Nov, 2019

长对话摘要的探索研究：何有效、何下一步

本文探索了对话摘要的三种策略：扩展变压器模型、检索后摘要流水线模型和分层对话编码模型，并在三个长对话数据集（QMSum、MediaSum、SummScreen）上进行了实验。结果表明，检索后摘要流水线模型具有最佳性能，并说明强大的检索模型和基于外部摘要数据集的预训练可以进一步提高摘要质量。

Sep, 2021

TODSum: 带状态跟踪的任务导向对话摘要

本文介绍了一个大型的任务导向对话摘要数据集(TODSum)，并提出了一种基于对话状态的结构化对话摘要模型来提高生成摘要的忠实度，证明了对话结构引导的有效性，并讨论了TODSum的当前问题和未来的发展方向。

Oct, 2021

CONFIT：基于语言学对比微调的忠实对话摘要

通过 ConFiT 训练方法及一系列的模块化目标来改善抽象型对话摘要的事实准确性，最终生成的摘要数据质量得到了显著提高。

Dec, 2021

使用伪重述的方式进行后训练对话摘要

该论文提出了一种基于预训练语言模型转换对话到叙述语言的技术，利用此技术可以显著提高对话摘要的性能，而且具有低的实施成本。

Apr, 2022

对话摘要中序列长度的重点研究

该研究探讨了对话摘要长度的影响因素，分析了摘要生成模型输出与人类参考文本的长度差异，并提出了基于长度感知的摘要生成模型，对DialogSum和SAMSum数据集进行实验，取得了显著的性能提升。

Sep, 2022

利用非对话摘要进行对话摘要

本文提出了一种方法，利用非对话摘要数据来增强对话摘要系统，通过转换文档摘要数据对来创建更适合对话摘要的训练数据，使其具有非对话数据集的良好特性，增强了在所有训练方案中的可信度。实验证明，利用非对话数据进行训练，可以显著提高摘要性能以及保持数据来源的准确性。

Oct, 2022

对话摘要中忠实度的分析和评估

本文提出了一种系统评估对话摘要的方法，并通过人工分析发现现有模型中有超过35%生成的摘要与原始对话不符，其评估工具与样本数据可用于未来的研究。

Oct, 2022

CADS: 抽象对话概括的挑战的系统文献综述

通过系统性地回顾2019年至2024年间发表的1262篇独特研究论文，本文总结了基于Transformer的英语对话抽象总结的研究，并涵盖了对话总结中的主要挑战和相应的技术，例如基于图的方法、额外的训练任务和计划策略。虽然一些挑战，如语言，已经取得了相当大的进展，但其他一些挑战，如理解、准确性和显著性，仍然困难，具有重要的研究机会。

Jun, 2024

通过口语理解任务提高人际对话摘要的可靠性

本研究解决了人际对话摘要过程中准确性和信度不足的问题。通过引入任务相关的语义信息，提出了一种新的评估标准，并提供了增强标注数据的新数据集版本，从而提高了摘要质量。研究表明，整合任务相关信息的模型能够显著提高摘要的准确性，带来积极影响。

Sep, 2024