可扩展的多领域对话状态跟踪
本文提出了一种新的架构,利用多粒度的注意力机制来更稳健地编码对话历史和槽的语义,用于实现准确的跨域对话状态跟踪,并在 MultiWoZ 2.1 数据集上将联合目标准确率提高了 5%(绝对值),并在零 - shot 设置下比现有最先进技术提高至多 2%(绝对值)。
Feb, 2020
该研究针对对话系统中特定目标和本体的对话状态跟踪模型的可扩展性问题,提出了一种将对话行为融入到对话模型设计中,利用机器阅读理解预测跨域对话状态的方法,并在实验结果中表现出较高的准确度,为未来的面向任务的对话系统提供了对话状态设计的指导。
Aug, 2022
通过使用分层编解码结构直接生成信念状态序列的方法,我们提出了一种不需要预定义本体列表的对话状态跟踪方法,并在多域和单域对话状态跟踪数据集上进行了实验,取得了最先进的性能。
Sep, 2019
本文提出一种基于问题回答的多领域对话状态跟踪方法(DSTQA),并利用动态演化的知识图谱显式地学习(领域、槽)对之间的关系,相较于最新的模型在 MultiWOZ 2.0 和 2.1 数据集上有 5.80%和 12.21%的相对改进,且在领域适应设置中始终优于最先进的模型。
Nov, 2019
本研究提出一种新的 Goal-oriented dialogue systems 框架,其中的 dialogue state tracker 可适用于 multiple domains,且不需要特定领域的先验知识,预训练的词嵌入技术有助于提高性能。
Nov, 2018
本文提出了一种基于 BERT 模型的 GOaL-Oriented 多任务对话状态跟踪器(GOLOMB),该模型通过查询对话历史记录中的槽口和服务的描述以及可能的槽口值来传输多域对话中的槽口值,并具有扩展到未见过的槽口类型的能力。我们的模型在 SGD 数据集上取得了 53.97%的联合目标准确率,优于基线模型。
Feb, 2020
本文提出了一种新的多任务学习方法,旨在为面向任务的对话系统中的语言理解(LU)和对话状态跟踪(DST)进行学习。多任务训练使得编码用户话语的神经网络层用于 LU 和 DST,通过减少网络参数并提高性能。 本研究提出了 DST 框架,用于考虑有大量或无限可能值的插槽及以往对话中未见过的槽值,并探讨了在 LU 和 DST 输出上使用计划采样来弥合训练和推理之间的差距。
Nov, 2018
本文探讨了利用关系图与 relational-GCN 图卷积网络构建聊天机器人多域对话跟踪模型的方法,实验结果表明,该方法实现了新的最佳性能,优于使用现有方法提出的深度学习技术的性能。
Oct, 2020
本文提出一种 Dialogue State Distillation Network(DSDN)用于进行任务导向的对话系统中的 Dialogue State Tracking(DST),并且在 MultiWOZ 2.0 和 MultiWOZ 2.1 数据集上实验证明,该网络可以动态地利用先前的对话状态并避免引入误差传播,同时还可以有效地捕捉来自对话语境的插槽共同更新关系
Feb, 2023
本文提出了一种领域无关的抽取式问答方法用于对话状态跟踪,通过训练一个分类器来预测多个领域的出现情况,将复杂的领域信息进行分离并在活动领域提取跨域问题答案,在多个数据集上达成了优秀的零 - shot 转移模型表现。
Apr, 2022