可转移对话状态跟踪的模式编码
本文介绍了一种基于深度学习的可伸缩的多领域对话状态跟踪方法,通过引入一个新的状态跟踪框架,该框架独立于具体的槽值集合,并将对话状态表示为候选值集合的分布,此方法能够快速适应新领域,提高跨领域和可扩展性。
Dec, 2017
本文介绍了 DSTC 8 轨道4:基于模式的对话状态跟踪的方法以及测试结果。我们提出了一种端到端的DST系统,该系统包括针对非分类插槽的MRC模型和对于分类插槽的Wide & Deep模型。通过实验,证明我们的方法在测试数据集中得到了优异的性能。
Dec, 2019
本文介绍了第8届对话系统技术挑战赛的Schema-Guided对话状态跟踪任务,其目标是开发适用于大型虚拟助手的对话状态跟踪模型,重点是跨域的数据高效联合建模和新API的零-shot推广。本任务提供了一个包含16个领域超过16000个对话的数据集,其中包括一个能够零-shot推广到新API的基线模型。本文介绍了任务定义、数据集和评估方法,并概述了提交系统的方法和结果,以突出现今最先进技术的总体趋势。
Feb, 2020
本文提出了一种基于内部和外部注意机制的上下文和架构融合网络来编码对话上下文和架构图,能够在MultiWOZ 2.0和MultiWOZ 2.1基准测试中获得最新的最佳性能的开放词汇DST。
Apr, 2020
本文介绍了一种基于BERT的快速和强健的模型FastSGT用于在目标导向对话系统中跟踪对话状态,在实验中,FastSGT在保持计算和内存消耗效率的同时,显着提高了准确性,并通过数据增强显示了提高准确性的有效性。
Aug, 2020
该研究论文提出了一种新的对话状态追踪方法,使用Seq2Seq-DU,该方法通过两个基于BERT的编码器来编码对话中的话语和模式的描述,可以有效地处理类别和非类别槽,并能够联合建模意图、槽和槽值,其效果较现有方法更为优越。
Nov, 2020
本文提出了一种领域无关的抽取式问答方法用于对话状态跟踪,通过训练一个分类器来预测多个领域的出现情况,将复杂的领域信息进行分离并在活动领域提取跨域问题答案,在多个数据集上达成了优秀的零-shot转移模型表现。
Apr, 2022
该研究提出了一种名为动态架构图融合网络(DSGFNet)的方法,它能够明确融合事先的槽-域成员关系和对话感知动态槽关系,且能够利用这些架构图来实现跨领域知识传递,此方法在Dialogue State Tracking领域内的实证结果优于现有方法。
Apr, 2022
我们提出了一种基于图的框架,通过将对话模式编码为图神经网络来嵌入预训练语言模型,从而在特定领域上对模型进行了更好地自适应,实验证明该方法在多领域对话状态跟踪方面优于其他方法。
Nov, 2023