长对话摘要：一项分析

Feb, 2024

Long Dialog Summarization: An Analysis

Ankan Mullick, Ayan Kumar Bhowmick, Raghav R, Ravi Kokku, Prasenjit Dey...

TL;DR对于不同的领域来说，长对话摘要的一种模型无法很好地执行各种任务，因此本研究探讨了当前领域内长对话摘要的最新方法和评估指标。

Abstract

dialog summarization has become increasingly important in managing and comprehending large-scale conversations across various domains. This task presents unique challenges in capturing the key points, context, an

dialog summarization large-scale conversations multi-turn long conversations contextually rich summaries benchmark metrics

发现论文，激发创造

对话自动摘要研究综述：新进展和新领域

对话摘要化是将原始对话压缩成涵盖重要信息的短版，用于减轻对话数据负载，本研究从多个领域（包括会议，聊天，电子邮件，客户服务和医疗对话）全面系统地调查了对话摘要化的现状和研究进展，包括可用于研究数据集的总览和两个排行榜，并提出了一些未来的研究方向，如忠实度、多模态、多领域和多语言对话摘要化。

Jul, 2021

长对话摘要的探索研究：何有效、何下一步

本文探索了对话摘要的三种策略：扩展变压器模型、检索后摘要流水线模型和分层对话编码模型，并在三个长对话数据集（QMSum、MediaSum、SummScreen）上进行了实验。结果表明，检索后摘要流水线模型具有最佳性能，并说明强大的检索模型和基于外部摘要数据集的预训练可以进一步提高摘要质量。

Sep, 2021

SUMBot: 开放域对话系统中的上下文概述

本文研究了在开放式对话系统中将相关信息作为上下文的问题，并提出了一种替换上下文部分的简易方法以增加模型跟踪先前相关信息的能力，以期提高答案生成任务的效果。

Oct, 2022

对话摘要中序列长度的重点研究

该研究探讨了对话摘要长度的影响因素，分析了摘要生成模型输出与人类参考文本的长度差异，并提出了基于长度感知的摘要生成模型，对 DialogSum 和 SAMSum 数据集进行实验，取得了显著的性能提升。

Sep, 2022

对话摘要的一袋技巧

本研究针对对话摘要技术所面临的特殊需求，探索处理多个发言者对话识别、否定理解、情景推理和非正式语言理解四大挑战，并使用预先训练的序列到序列语言模型进行实验，通过发言者名称代替、否定范围突出、多任务学习与域内预训练等方法提高摘要表现，超越强基准结果。

Sep, 2021

在大型语言模型中，递归总结实现了长期的对话记忆

使用大型语言模型递归生成摘要 / 记忆，从而提高长期记忆能力，进而解决开放领域对话系统中遗忘重要信息的问题。实验证明，该方法可以在长对话环境中生成更加一致的回应。

Aug, 2023

抽象化对话摘要分类：情景、方法与未来方向

调查了目前存在的抽象对话总结的工作，包括输入对话的类型、途径、评估等，并列出了在不同情景下的数据集和常用的评估度量，分析了趋势和未来发展方向。

Oct, 2022

DialogSum：一个真实场景下的对话摘要数据集

提出了 DialogSum，一种大规模标注的对话摘要数据集，通过对该数据集使用最先进的神经摘要器进行经验分析，结果表明对话摘要中存在诸如口语术语、特殊话语结构、代词和省略、语用学和社会常识等独特挑战，需要特定的表示学习技术来更好地处理。

May, 2021

面向客户服务的面向主题的口语对话摘要与关键词感知主题建模

本文提出了一种基于主题增强的两阶段对话摘要生成器并结合注意力感知神经主题模型 (SATM) 来进行主题定向对话摘要，展示了其在客户服务数据集上的优越性。

Dec, 2020

DialogLM: 面向长对话理解和摘要的预训练模型

本文提出了一种用于长对话理解和摘要的预训练框架，其中包括以窗口为基础的去噪方法和稀疏注意力机制，并通过实验表明 DialogLM 预训练模型显著优于现有的模型。

Sep, 2021