对话摘要化是将原始对话压缩成涵盖重要信息的短版,用于减轻对话数据负载,本研究从多个领域(包括会议,聊天,电子邮件,客户服务和医疗对话)全面系统地调查了对话摘要化的现状和研究进展,包括可用于研究数据集的总览和两个排行榜,并提出了一些未来的研究方向,如忠实度、多模态、多领域和多语言对话摘要化。
Jul, 2021
本文对多方会议情境下的自动摘要这一任务涉及到的难点、数据集以及系统进行了综述,并介绍了未来的研究方向。
Aug, 2022
本文详细介绍了文本摘要的各种方法,包括提取和抽象两种途径,评估指标、基准数据集与未来的研究展望,并讨论了生成摘要的不同评估方法与相关研究中可能出现的挑战和研究机遇。
Mar, 2022
文本摘要是自然语言处理领域的一个著名应用,可以自动根据给定的上下文生成带有重要信息的摘要,特别适用于会议总结等多主题、多人参与的长篇文档。我们提出了 Locater 模型用于提取有关片段,然后通过 Summarizer 模型进行总结,并应用不同的词嵌入技术进行了比较研究以提高摘要的一致性。
Feb, 2024
本研究发现会议摘要的句子与会议议程有关,基于此提出了一种动态滑动窗口策略来解决长会议记录的自动文本摘要问题。实验结果表明,相较于传统模型,该方法获得了更高的文本一致性。
Aug, 2021
基于大型语言模型的对话总结为会议回顾提供了潜力,但仍存在个人相关性和总结质量等方面的限制。研究发现,需要与用户合作设计人工智能系统,通过自然交互学习和改进,克服这些限制。
Jul, 2023
对于不同的领域来说,长对话摘要的一种模型无法很好地执行各种任务,因此本研究探讨了当前领域内长对话摘要的最新方法和评估指标。
本文提出了一种新颖的抽象会议摘要网络,采用分层结构和角色向量来处理会议记录,并在大规模新闻摘要数据上预训练模型,实现了在 ICSI 数据集上自动指标和人工评价方面的表现优于之前的方法。
Apr, 2020
本文旨在简明扼要地阐述抽象文本摘要现状,强调需采用预训练编码器 - 解码器模型与大型自回归语言模型。此外,讨论了摘要系统评估的挑战和用于零 - shot 摘要的 instruction tuned 模型的潜力,最后概述了如何将摘要系统整合到商业应用中。
May, 2023
本文探索了对话摘要的三种策略:扩展变压器模型、检索后摘要流水线模型和分层对话编码模型,并在三个长对话数据集(QMSum、MediaSum、SummScreen)上进行了实验。结果表明,检索后摘要流水线模型具有最佳性能,并说明强大的检索模型和基于外部摘要数据集的预训练可以进一步提高摘要质量。
Sep, 2021