DiSTRICT: 基于检索驱动的上下文调控的对话状态跟踪
本文介绍了一种基于深度学习的可伸缩的多领域对话状态跟踪方法,通过引入一个新的状态跟踪框架,该框架独立于具体的槽值集合,并将对话状态表示为候选值集合的分布,此方法能够快速适应新领域,提高跨领域和可扩展性。
Dec, 2017
本研究提出一种新的Goal-oriented dialogue systems框架,其中的dialogue state tracker可适用于multiple domains,且不需要特定领域的先验知识,预训练的词嵌入技术有助于提高性能。
Nov, 2018
本文介绍了第8届对话系统技术挑战赛的Schema-Guided对话状态跟踪任务,其目标是开发适用于大型虚拟助手的对话状态跟踪模型,重点是跨域的数据高效联合建模和新API的零-shot推广。本任务提供了一个包含16个领域超过16000个对话的数据集,其中包括一个能够零-shot推广到新API的基线模型。本文介绍了任务定义、数据集和评估方法,并概述了提交系统的方法和结果,以突出现今最先进技术的总体趋势。
Feb, 2020
本文提出了一种新的架构,利用多粒度的注意力机制来更稳健地编码对话历史和槽的语义,用于实现准确的跨域对话状态跟踪,并在MultiWoZ 2.1数据集上将联合目标准确率提高了5%(绝对值),并在零-shot设置下比现有最先进技术提高至多2%(绝对值)。
Feb, 2020
利用机器阅读理解(RC)方法在对话状态跟踪中,针对模型架构和数据集两个方面进行改进并应用到多种领域,实现了很好的跨领域通用性,并在少数据情形下(few-shot scenarios)表现出了更好的性能,即便在零状态跟踪数据下(zero-shot scenarios),也在MultiWOZ 2.1数据集中表现出很高的性能。
Apr, 2020
本文提出了 Dialogue State Tracking with Entity Adaptive Pre-training (DSTEA) 方法,其通过选择性知识掩蔽使模型更好地训练,从而在 MultiWOZ 2.0, 2.1, and 2.2 数据集上达到了更好的性能,并通过各种比较实验验证了其有效性。
Jul, 2022
对话状态跟踪是对话系统中的重要环节,虽然神经方法实现了显著的进展,但对话系统的一些关键方面,如可拓展性等仍未得到充分探索,本文提出了未来研究的几个方向。
Jul, 2022
该论文研究了如何在对话管理中跟踪用户的信念,通过使用软提示令牌嵌入来学习任务属性,可以显著减少先前工作所需的参数数量,同时实现更好的低资源对话状态跟踪性能。
Jan, 2023
我们使用 ChatGPT ,一个通用语言模型,展示了它在零-shot DST 上达到的最先进的表现,并证明了通用模型在专业系统替代方面的能力受到其属性的限制,但我们认为通用模型的语境学习能力很可能成为支持专门的动态对话状态跟踪器开发的有力工具。
Jun, 2023
对ChatGPT在对话状态跟踪(DST)任务中的能力进行了初步评估,发现其表现出色。为了解决ChatGPT的局限性,提出了基于小型开源模型的LLM驱动的DST框架LDST,通过领域-槽位指令调优方法,LDST在零样本和少样本设置下相较于之前的SOTA方法取得了显著的性能提升。提供源代码以保证可复现性。
Oct, 2023