人在环节下的抽象式对话摘要

Dec, 2022

Human-in-the-loop Abstractive Dialogue Summarization

Jiaao Chen, Mohan Dodda, Diyi Yang

TL;DR本文提出引入不同层次的人类反馈，结合增强学习以提高抽象对话摘要的质量。实验表明，该方法在人类判断方面优于监督式基线，并能提高摘要质量。

Abstract

abstractive dialogue summarization has received increasing attention recently. Despite the fact that most of the current dialogue summarization systems are trained to maximize the likelihood of human-written summaries and have achieved significant results, there is still a huge gap in

abstractive dialogue summarization human feedback reinforcement learning coherence accuracy

发现论文，激发创造

对话摘要中忠实度的分析和评估

本文提出了一种系统评估对话摘要的方法，并通过人工分析发现现有模型中有超过 35% 生成的摘要与原始对话不符，其评估工具与样本数据可用于未来的研究。

Oct, 2022

抽象会议总结：一项调查

本文对多方会议情境下的自动摘要这一任务涉及到的难点、数据集以及系统进行了综述，并介绍了未来的研究方向。

Aug, 2022

具有草图监督的可控抽象对话摘要

本文针对抽象对话摘要的质量和粒度控制问题，提出了一种包含两个主要组成部分和阶段的模型，实现了基于伪标注疑问代词类别和基于组成句法分析提取关键词短语生成初步摘要，并通过自动确定或控制源文本中不同文本片段预测和突出显示给定对话的生成摘要句子数量。在最大的对话摘要语料库 SAMSum 上表现出优越性能，达到了 50.79 的 ROUGE-L 评分，并展示了竞争性高的人类评估结果和可控制的效果。

May, 2021

对话自动摘要研究综述：新进展和新领域

对话摘要化是将原始对话压缩成涵盖重要信息的短版，用于减轻对话数据负载，本研究从多个领域（包括会议，聊天，电子邮件，客户服务和医疗对话）全面系统地调查了对话摘要化的现状和研究进展，包括可用于研究数据集的总览和两个排行榜，并提出了一些未来的研究方向，如忠实度、多模态、多领域和多语言对话摘要化。

Jul, 2021

具有对话结构的多视角序列到序列模型用于摘要对话总结

本研究提出了一种多视角序列到序列模型，其通过提取来自不同视角的非结构化日常聊天中的会话结构来表示会话，然后利用多视角解码器来合并不同视角生成对话摘要，在大规模对话摘要语料库上的实验结果表明，本研究方法在自动评估和人类判断方面均明显优于之前的最新模型。

Oct, 2020

论抽象化摘要中的忠实度与客观性

分析了神经文本生成模型在抽象文档摘要生成方面的局限性，并发现这些模型非常容易产生虚假内容。人类评估显示，预训练模型生成的摘要不仅在原始度量标准（即 ROUGE）方面更好，而且在生成忠实和真实摘要方面也更好，文本蕴含度量更好地相关于忠实度，有可能成为自动评估度量标准以及训练和解码标准的前景。

May, 2020

借助人类反馈递归地对图书进行摘要

本文介绍利用机器学习方法，在小部分任务中辅助人类反馈来逐步完成整个任务，并用所收集的大量数据 fine-tune GPT-3 模型，将其应用于整本小说的抽象式摘要，最后得到了可以在几个案例中与人类摘要匹配的，甚至匹配人类摘要质量的总结。

Sep, 2021

基于句子门控模型和对话行为优化的抽象化对话摘要

本论文旨在通过引入对话行为，设计一种基于句子门控机制的神经摘要模型，以更好地模拟对话行为和摘要之间的关系，从而提高其在 AMI 会议语料库上的性能表现。实验结果表明，所提出的模型相对于现有的基线表现有很大改善，突显出对话行为所提供的交互信号的实用性。

Sep, 2018

面向主题感知的对比学习用于抽象式对话摘要

通过引入一种叫做对比学习的技术来解决对话总结中信息分散和主题变化的挑战，该方法使用了两个具体的辅助任务 (coherence detection 和 sub-summary generation)，在基于原始对话总结任务上取得了最优性能，显著超过强基准模型。

Sep, 2021

抽象化对话摘要分类：情景、方法与未来方向

调查了目前存在的抽象对话总结的工作，包括输入对话的类型、途径、评估等，并列出了在不同情景下的数据集和常用的评估度量，分析了趋势和未来发展方向。

Oct, 2022