支持话语流建模和事实规范化的对话摘要

Aug, 2021

支持话语流建模和事实规范化的对话摘要

Dialogue Summarization with Supporting Utterance Flow Modeling and Fact Regularization

Wang Chen, Piji Li, Hou Pong Chan, Irwin King

TL;DR本文提出了一种基于端到端神经模型的对话摘要生成方法，该方法包括支持话语流建模模块和事实规范化模块；支持话语流建模有助于生成连贯的摘要，而事实规范化则有利于提高生成摘要的事实正确性；同时引入了一个新的基准数据集用于对话摘要生成，实验表明该方法的有效性和高性能。

Abstract

dialogue summarization aims to generate a summary that indicates the key points of a given dialogue. In this work, we propose an end-to-end neural model for →

dialogue summarization end-to-end neural model supporting utterance flow modeling fact regularization module benchmark dataset

发现论文，激发创造

基于大型语言模型的事实对话摘要

通过使用符号知识蒸馏方法改善小型预训练模型的事实一致性，我们在对话摘要中取得了更好的事实一致性，同时保持了连贯性、流畅性和相关性。

Jun, 2024

基于句子门控模型和对话行为优化的抽象化对话摘要

本论文旨在通过引入对话行为，设计一种基于句子门控机制的神经摘要模型，以更好地模拟对话行为和摘要之间的关系，从而提高其在 AMI 会议语料库上的性能表现。实验结果表明，所提出的模型相对于现有的基线表现有很大改善，突显出对话行为所提供的交互信号的实用性。

Sep, 2018

为提高语义一致性，正则化中国社交媒体抽象文本摘要的输出分布

本文探讨了抽象文本摘要中生成内容与原文义不相符的问题，并提出了以正则化为基础的序列到序列模型和实用人工评估方法以解决问题。实验结果表明，该方法在提高人工评估的语义一致性方面比以前的模型有效。

May, 2018

利用规范流和高效训练提升摘要生成

本研究提出了 FlowSUM，一种基于正则化流的变分编码器 - 解码器框架，用于 Transformer-based 摘要。我们的方法解决了变分摘要中两个主要挑战：潜在表示中的语义信息不足和训练期间的后验崩溃。为了解决这些挑战，我们采用正则化流来实现灵活的潜在后验建模，并提出了一种改进的门机制控制交替激进训练（CAAT）策略。实验结果表明，FlowSUM 显著提高了生成摘要的质量，并在对推理时间几乎没有影响的情况下释放了知识蒸馏的潜力。此外，我们研究了正则化流中的后验崩溃问题，并分析了训练策略、门初始化以及所使用的正则化流的类型和数量对摘要质量的影响，为未来的研究提供了有价值的见解。

Nov, 2023

使用伪重述的方式进行后训练对话摘要

该论文提出了一种基于预训练语言模型转换对话到叙述语言的技术，利用此技术可以显著提高对话摘要的性能，而且具有低的实施成本。

Apr, 2022

对话摘要的一袋技巧

本研究针对对话摘要技术所面临的特殊需求，探索处理多个发言者对话识别、否定理解、情景推理和非正式语言理解四大挑战，并使用预先训练的序列到序列语言模型进行实验，通过发言者名称代替、否定范围突出、多任务学习与域内预训练等方法提高摘要表现，超越强基准结果。

Sep, 2021

CONFIT：基于语言学对比微调的忠实对话摘要

通过 ConFiT 训练方法及一系列的模块化目标来改善抽象型对话摘要的事实准确性，最终生成的摘要数据质量得到了显著提高。

Dec, 2021

长对话摘要的探索研究：何有效、何下一步

本文探索了对话摘要的三种策略：扩展变压器模型、检索后摘要流水线模型和分层对话编码模型，并在三个长对话数据集（QMSum、MediaSum、SummScreen）上进行了实验。结果表明，检索后摘要流水线模型具有最佳性能，并说明强大的检索模型和基于外部摘要数据集的预训练可以进一步提高摘要质量。

Sep, 2021

对话摘要模型在自然出现的变化下的稳健性评估

对话摘要任务涉及在保留最显著信息的同时对长对话进行总结。实际生活中的对话经常会出现自然发生的变化（例如，重复、犹豫），现有的对话摘要模型在此类对话上的性能下降。本研究系统地研究了此类变化对最先进的对话摘要模型的影响，使用公开可用数据集。为了模拟真实生活中的变化，我们引入了两种类型的扰动：以错误和语言变化更改单个话语的话语级扰动，以及添加非信息性交流（例如，重复、问候）的对话级扰动。我们沿着一致性、显著性和忠实度三个鲁棒性的维度进行分析，这些维度捕捉了摘要模型性能的不同方面。我们发现，输入变化会影响精调模型和指导模型，而后者更容易受到影响，特别是在对话级扰动方面。我们还通过人工评估验证了我们的发现。最后，我们研究了使用部分扰动数据对精调模型的鲁棒性是否可以提高，并观察到这种方法对于解决当前模型中的鲁棒性挑战不足，因此需要更彻底的研究来找到更好的解决方案。总体而言，我们的工作强调对话摘要中的鲁棒性挑战，并为未来的研究提供了见解。

Nov, 2023

摘要生成中的话语理解和事实一致性

该研究提出了一种新的基于 Transformer 的 Co-opNet 框架，旨在消除抽象摘要生成中存在的一些问题，如虚构信息，连贯性问题，流故事性等，并通过实验证明，其与竞争基线相比，具有显著的全局连贯性。

Jul, 2019