本文提出了一种基于常识增强的基于任务的对话任务,并描述了 Task2Dial 数据集,这是一个基于文档的任务对话的新数据集,在此设置中,IF 可以提出澄清问题,这些问题可能不基于基础文档,需要常识知识来回答。
Apr, 2022
doc2dial 是一种以文档为基础的目标导向的对话数据集,包含来自四个领域超过 480 个文档的约 4800 个带注释的对话,通过引入多重对话建模任务和基线方法来评估数据集的多功能性。
Nov, 2020
展示一种将 fine-tuned 的生成模型与人工的交互式摘要整理系统相结合的生产系统,以解决销售电话摘要的实际应用情景中存在的困难问题,包括长对话、内容验证、缺乏标记数据和质量评估,并说明了 GPT-3 可以用作离线数据标记器以解决数据贫乏和隐私限制等问题。在公共数据集上进行的实验表明,我们的模型在解决摘要和内容验证任务方面有了显著的改善。
本文介绍了一种基于自然语言描述的任务导向对话系统,并提出了一种简单而有效的基于描述的对话状态跟踪模型(D3ST),证明其在多个基准测试中具有更高的性能和数据效率。
Jan, 2022
本文介绍了一个大型的任务导向对话摘要数据集 (TODSum),并提出了一种基于对话状态的结构化对话摘要模型来提高生成摘要的忠实度,证明了对话结构引导的有效性,并讨论了 TODSum 的当前问题和未来的发展方向。
Oct, 2021
该研究提出了 MultiDoc2Dial,这是一个针对建模基于多个文档的目标导向对话的新任务和数据集,旨在为更真实的信息寻求对话场景提供支持,并介绍了一个新的包含来自四个不同领域的基于多个文档的对话的数据集,探索了其基于对话和文档的上下文表示,提供了强基线方法和各种实验结果,支持进一步的研究工作。
Sep, 2021
对话摘要化是将原始对话压缩成涵盖重要信息的短版,用于减轻对话数据负载,本研究从多个领域(包括会议,聊天,电子邮件,客户服务和医疗对话)全面系统地调查了对话摘要化的现状和研究进展,包括可用于研究数据集的总览和两个排行榜,并提出了一些未来的研究方向,如忠实度、多模态、多领域和多语言对话摘要化。
Jul, 2021
本文提出基于语言模型的少样本对话状态追踪方法,将对话状态追踪问题重新表述为对话摘要问题,并使用合成的对话摘要训练模型。经实验证明,该方法在跨领域和多领域设置下的效果都优于以往方法,并提升训练和推理速度。
Mar, 2022
AUTODIAL 是一种多任务对话模型,通过使用平行解码器来预测对话行为、领域、意图和状态,较之 SimpleTOD 等生成式方法,使用分类式解码器可大幅度减少内存占用并提高推理速度,在三种对话任务上拥有 11 倍少的参数以及 3-6 倍的推理速度提升,可为在资源有限的环境下部署对话模型提供可行的选择。
Mar, 2023
本文介绍如何利用 DialoGPT 提供未标注的语料,作为无监督对话注释器,来对两个对话概括数据集 SAMSum 和 AMI 进行标注,使用 DialoGPT 进行标注取得了很显著的成果,并在 SAMSum 数据集上取得了新的最先进水平。
May, 2021