人在环节下的抽象式对话摘要
本文针对抽象对话摘要的质量和粒度控制问题,提出了一种包含两个主要组成部分和阶段的模型,实现了基于伪标注疑问代词类别和基于组成句法分析提取关键词短语生成初步摘要,并通过自动确定或控制源文本中不同文本片段预测和突出显示给定对话的生成摘要句子数量。在最大的对话摘要语料库 SAMSum 上表现出优越性能,达到了 50.79 的 ROUGE-L 评分,并展示了竞争性高的人类评估结果和可控制的效果。
May, 2021
对话摘要化是将原始对话压缩成涵盖重要信息的短版,用于减轻对话数据负载,本研究从多个领域(包括会议,聊天,电子邮件,客户服务和医疗对话)全面系统地调查了对话摘要化的现状和研究进展,包括可用于研究数据集的总览和两个排行榜,并提出了一些未来的研究方向,如忠实度、多模态、多领域和多语言对话摘要化。
Jul, 2021
本研究提出了一种多视角序列到序列模型,其通过提取来自不同视角的非结构化日常聊天中的会话结构来表示会话,然后利用多视角解码器来合并不同视角生成对话摘要,在大规模对话摘要语料库上的实验结果表明,本研究方法在自动评估和人类判断方面均明显优于之前的最新模型。
Oct, 2020
分析了神经文本生成模型在抽象文档摘要生成方面的局限性,并发现这些模型非常容易产生虚假内容。人类评估显示,预训练模型生成的摘要不仅在原始度量标准(即 ROUGE)方面更好,而且在生成忠实和真实摘要方面也更好,文本蕴含度量更好地相关于忠实度,有可能成为自动评估度量标准以及训练和解码标准的前景。
May, 2020
本文介绍利用机器学习方法,在小部分任务中辅助人类反馈来逐步完成整个任务, 并用所收集的大量数据 fine-tune GPT-3 模型,将其应用于整本小说的抽象式摘要,最后得到了可以在几个案例中与人类摘要匹配的,甚至匹配人类摘要质量的总结。
Sep, 2021
本论文旨在通过引入对话行为,设计一种基于句子门控机制的神经摘要模型,以更好地模拟对话行为和摘要之间的关系,从而提高其在 AMI 会议语料库上的性能表现。实验结果表明,所提出的模型相对于现有的基线表现有很大改善,突显出对话行为所提供的交互信号的实用性。
Sep, 2018
通过引入一种叫做对比学习的技术来解决对话总结中信息分散和主题变化的挑战,该方法使用了两个具体的辅助任务 (coherence detection 和 sub-summary generation),在基于原始对话总结任务上取得了最优性能,显著超过强基准模型。
Sep, 2021
调查了目前存在的抽象对话总结的工作,包括输入对话的类型、途径、评估等,并列出了在不同情景下的数据集和常用的评估度量,分析了趋势和未来发展方向。
Oct, 2022