利用时间表达网络的神经对话状态跟踪
本文介绍了一种基于深度学习的可伸缩的多领域对话状态跟踪方法,通过引入一个新的状态跟踪框架,该框架独立于具体的槽值集合,并将对话状态表示为候选值集合的分布,此方法能够快速适应新领域,提高跨领域和可扩展性。
Dec, 2017
本文提出一种 Dialogue State Distillation Network(DSDN)用于进行任务导向的对话系统中的 Dialogue State Tracking(DST),并且在 MultiWOZ 2.0 和 MultiWOZ 2.1 数据集上实验证明,该网络可以动态地利用先前的对话状态并避免引入误差传播,同时还可以有效地捕捉来自对话语境的插槽共同更新关系
Feb, 2023
本文提出了一种新颖的端到端可训练的神经网络模型,用于处理任务导向的对话系统,该模型将对话状态、API 调用和结构化的知识库查询结果相结合,以成功完成任务导向的对话,并且能够以联合学习为基础,更好地处理对话历史,生成结构良好的系统响应。在餐厅搜索领域的实验结果表明,相比先前的端到端可训练的神经网络模型,我们提出的模型在适当的系统响应生成方面表现更为卓越。
Aug, 2017
本文探讨了利用关系图与 relational-GCN 图卷积网络构建聊天机器人多域对话跟踪模型的方法,实验结果表明,该方法实现了新的最佳性能,优于使用现有方法提出的深度学习技术的性能。
Oct, 2020
本文提出了一种优化现有数据驱动的神经信念跟踪(NBT)对话状态跟踪(DST)框架的方法,该方法使用两个不同的统计更新机制替换手工制作的信仰状态更新机制和基于规则的模块,从而实现非常少的额外模型参数的对话动态建模,从而提供了一种用于构建资源轻量级 DST 模型的强大框架。在三种不同语言的 DST 评估中,我们证明了这种模型的竞争性能。
May, 2018
对话状态跟踪是对话系统中的重要环节,虽然神经方法实现了显著的进展,但对话系统的一些关键方面,如可拓展性等仍未得到充分探索,本文提出了未来研究的几个方向。
Jul, 2022
本文提出了一种基于非自回归框架的对话状态跟踪方法 (NADST),能够考虑域和槽之间的潜在依赖关系,优化对话状态预测的完整集合。该方法的非自回归性质不仅可以并行进行解码,大大降低了实时对话响应生成的延迟,而且可以在令牌级别检测槽之间的依赖关系。在 MultiWOZ 2.1 语料库上,我们的模型在所有领域上的联合精度达到了最先进水平,并且我们的模型的延迟比以前的最新技术低一个数量级,尤其当对话历史随时间推移时。
Feb, 2020
本文提出了 Dialogue State Tracking with Entity Adaptive Pre-training (DSTEA) 方法,其通过选择性知识掩蔽使模型更好地训练,从而在 MultiWOZ 2.0, 2.1, and 2.2 数据集上达到了更好的性能,并通过各种比较实验验证了其有效性。
Jul, 2022
本论文提出了一种多层次融合对话状态跟踪(DST)网络,通过建模每个对话轮次的交互,实现从以往对话历史和当前对话上下文中抽取对话状态信息,进行预测和融合,加强对当前对话状态的跟踪和理解,实验结果表明该模型在 MultiWOZ 2.0 和 MultiWOZ 2.1 数据集上取得了当前领先的 55.03% 和 59.07% 联合灵敏度值。
Jul, 2021