对话摘要中序列长度的重点研究

Sep, 2022

A Focused Study on Sequence Length for Dialogue Summarization

Bin Wang, Chen Zhang, Chengwei Wei, Haizhou Li

TL;DR该研究探讨了对话摘要长度的影响因素，分析了摘要生成模型输出与人类参考文本的长度差异，并提出了基于长度感知的摘要生成模型，对 DialogSum 和 SAMSum 数据集进行实验，取得了显著的性能提升。

Abstract

Output length is critical to dialogue summarization systems. The dialogue summary length is determined by multiple factors, including dialogue complexity, summary objective, and personal preferences. In this work

dialogue summarization summary length model output pretraining objectives length-aware summarizer

发现论文，激发创造

长对话摘要的探索研究：何有效、何下一步

本文探索了对话摘要的三种策略：扩展变压器模型、检索后摘要流水线模型和分层对话编码模型，并在三个长对话数据集（QMSum、MediaSum、SummScreen）上进行了实验。结果表明，检索后摘要流水线模型具有最佳性能，并说明强大的检索模型和基于外部摘要数据集的预训练可以进一步提高摘要质量。

Sep, 2021

长对话摘要：一项分析

对于不同的领域来说，长对话摘要的一种模型无法很好地执行各种任务，因此本研究探讨了当前领域内长对话摘要的最新方法和评估指标。

Feb, 2024

精准长度控制摘要

该论文提出了一种能够精确控制文本长度的文本生成框架，可以生成指定数量的词语或句子的摘要，且在维持或提高文本质量的同时，通过联合训练模型预测长度，实现生成最佳长度的摘要。作者对该框架在 CNNDM 数据集上进行了评估，结果表明其性能优于现有方法。

May, 2023

对话建模中说长道短

研究通过改变发言长度对对话模型生成回复质量的影响，发现在某些类型的对话中，可以将发言长度减少高达 72%，而不会对生成的回复质量产生明显影响。

Jan, 2024

对话自动摘要研究综述：新进展和新领域

对话摘要化是将原始对话压缩成涵盖重要信息的短版，用于减轻对话数据负载，本研究从多个领域（包括会议，聊天，电子邮件，客户服务和医疗对话）全面系统地调查了对话摘要化的现状和研究进展，包括可用于研究数据集的总览和两个排行榜，并提出了一些未来的研究方向，如忠实度、多模态、多领域和多语言对话摘要化。

Jul, 2021

非自回归句子摘要的字符级长度控制算法

本文提出一种基于 CTC 模型的动态规划算法，用于实现汉字级别的摘要长度控制，在提高 ROUGE 分数的同时保证摘要完整。

May, 2022

对话摘要的一袋技巧

本研究针对对话摘要技术所面临的特殊需求，探索处理多个发言者对话识别、否定理解、情景推理和非正式语言理解四大挑战，并使用预先训练的序列到序列语言模型进行实验，通过发言者名称代替、否定范围突出、多任务学习与域内预训练等方法提高摘要表现，超越强基准结果。

Sep, 2021

人在环节下的抽象式对话摘要

本文提出引入不同层次的人类反馈，结合增强学习以提高抽象对话摘要的质量。实验表明，该方法在人类判断方面优于监督式基线，并能提高摘要质量。

Dec, 2022

会议摘要的动态滑动窗口

本研究发现会议摘要的句子与会议议程有关，基于此提出了一种动态滑动窗口策略来解决长会议记录的自动文本摘要问题。实验结果表明，相较于传统模型，该方法获得了更高的文本一致性。

Aug, 2021

通过摘要原型引导的长度可控抽象摘要

本文提出了一种新的长度可控的抽象汇总模型，与以往仅根据编码器 - 解码器模型生成一篇总结不同，我们的模型在编码器 - 解码器模型中结合了单词级别的抽取模块，通过提取重要的词来控制长度，生成了一个同时具有信息和长度控制的汇总。

Jan, 2020