面向任务型对话的灵活结构模型
本篇论文采用潜在神经嵌入状态和学习选择性关注,以及复制上下文等技术,对话系统可以不依赖于显式的用户意图和信念状态而实现特定领域用户对话。它证明了简单的序列到序列神经网络结构与复制机制的有效性,并在每次对话回应生成方面比更复杂的记忆增强模型高出 7%,达到了 DSTC2 的最新水平。
Jan, 2017
本论文提出了一个基于编码器 - 解码器模型的任务导向对话系统的实用且新颖的框架,使其能够完成与外部数据库的交互和独立决策,并将聊天功能与插槽填充系统交替使用,以提高领域外恢复的能力。在实验中,使用公交信息系统的真实用户数据和人际对话数据,所提出的框架表现优异,且离线评估指标和任务成功率与人类用户相当。
Jun, 2017
提出了一种新颖的基于预训练语言模型的任务驱动对话状态追踪方法,利用基于模式的提示和模式描述提高了性能,适用于多个基准测试(MultiWOZ 2.2、MultiWOZ 2.1 和 M2M),实现了最先进的性能。
Sep, 2021
该论文提出了一种新的框架,将对话状态建模为固定大小的分布式表示,并使用注意机制查询知识库,以解决任务导向的对话系统中的问题。实验结果显示,这种框架在自动评估和人类评估上都明显优于其他基于序列到序列模型的模型。
Jun, 2018
本文介绍了一种基于深度强化学习的方法,使用策略梯度算法来优化基于任务且与视觉相关的对话,该方法在通过 Mechanical Turk 收集的 12 万个对话数据集上进行了测试,并提供了鼓舞人心的结果,可以解决生成自然对话和在复杂图像中发现特定对象的问题。
Mar, 2017
文章提出了一种基于多任务 BERT 模型的对话状态跟踪器,可以同时解决意图预测、请求插槽预测和插槽填充等三个 DST 任务,并采用高效和简洁的对话历史和服务架构编码来提高性能。通过对 SGD 数据集进行的评估,结果表明该方法在计算效率明显提高的同时,大幅度超越了基线 SGP-DST,并且性能表现接近于最先进的模型。
Jul, 2022
本文提出了一种新的架构,利用多粒度的注意力机制来更稳健地编码对话历史和槽的语义,用于实现准确的跨域对话状态跟踪,并在 MultiWoZ 2.1 数据集上将联合目标准确率提高了 5%(绝对值),并在零 - shot 设置下比现有最先进技术提高至多 2%(绝对值)。
Feb, 2020
通过使用分层编解码结构直接生成信念状态序列的方法,我们提出了一种不需要预定义本体列表的对话状态跟踪方法,并在多域和单域对话状态跟踪数据集上进行了实验,取得了最先进的性能。
Sep, 2019
本文介绍了第 8 届对话系统技术挑战赛的 Schema-Guided 对话状态跟踪任务,其目标是开发适用于大型虚拟助手的对话状态跟踪模型,重点是跨域的数据高效联合建模和新 API 的零 - shot 推广。本任务提供了一个包含 16 个领域超过 16000 个对话的数据集,其中包括一个能够零 - shot 推广到新 API 的基线模型。本文介绍了任务定义、数据集和评估方法,并概述了提交系统的方法和结果,以突出现今最先进技术的总体趋势。
Feb, 2020
本文介绍了我们在 DSTC-10 上构建对话模型的方法。为缩小口头和书面数据之间的差距,我们采用了大量数据扩增策略,包括人工误差注入和文本转语音转换。我们改良了预训练语言模型,并对每个子任务应用了集成算法,以训练稳健的口头对话模型。我们的方法在官方评估中排名第三,在最终的正式人类评估中排名第二。
Mar, 2022