基于状态图的跨领域对话状态跟踪
本文提出了一种基于内部和外部注意机制的上下文和架构融合网络来编码对话上下文和架构图,能够在 MultiWOZ 2.0 和 MultiWOZ 2.1 基准测试中获得最新的最佳性能的开放词汇 DST。
Apr, 2020
本文提出了一种新的架构,利用多粒度的注意力机制来更稳健地编码对话历史和槽的语义,用于实现准确的跨域对话状态跟踪,并在 MultiWoZ 2.1 数据集上将联合目标准确率提高了 5%(绝对值),并在零 - shot 设置下比现有最先进技术提高至多 2%(绝对值)。
Feb, 2020
本文介绍了一种新的混合架构,将 GPT-2 与来自 Graph Attention Networks 的表示相结合,以实现逐步预测插槽值,并捕获跨域的插槽之间的关系和依赖关系,以提高多域会话跟踪的性能。该模型通过图模块捕获插槽之间的相互依赖性并提高了跨多个域常见的值的预测。
Apr, 2021
本文介绍了一种基于深度学习的可伸缩的多领域对话状态跟踪方法,通过引入一个新的状态跟踪框架,该框架独立于具体的槽值集合,并将对话状态表示为候选值集合的分布,此方法能够快速适应新领域,提高跨领域和可扩展性。
Dec, 2017
本文提出一种基于问题回答的多领域对话状态跟踪方法(DSTQA),并利用动态演化的知识图谱显式地学习(领域、槽)对之间的关系,相较于最新的模型在 MultiWOZ 2.0 和 2.1 数据集上有 5.80%和 12.21%的相对改进,且在领域适应设置中始终优于最先进的模型。
Nov, 2019
本文提出了一种基于 Transformer 的框架,将 BERT 作为编码器和解码器,通过共同优化操作预测目标和值生成目标来实现多领域对话状态跟踪,同时重复使用编码器的隐藏状态构建平面编码器 - 解码器架构来实现有效的参数更新,实验表明我们的方法显著优于现有的最先进框架,并且达到了最佳本体论方法的非常有竞争力的性能。
Oct, 2020
该研究提出了一种名为动态架构图融合网络(DSGFNet)的方法,它能够明确融合事先的槽 - 域成员关系和对话感知动态槽关系,且能够利用这些架构图来实现跨领域知识传递,此方法在 Dialogue State Tracking 领域内的实证结果优于现有方法。
Apr, 2022
本文提出一种 Dialogue State Distillation Network(DSDN)用于进行任务导向的对话系统中的 Dialogue State Tracking(DST),并且在 MultiWOZ 2.0 和 MultiWOZ 2.1 数据集上实验证明,该网络可以动态地利用先前的对话状态并避免引入误差传播,同时还可以有效地捕捉来自对话语境的插槽共同更新关系
Feb, 2023
该研究针对对话系统中特定目标和本体的对话状态跟踪模型的可扩展性问题,提出了一种将对话行为融入到对话模型设计中,利用机器阅读理解预测跨域对话状态的方法,并在实验结果中表现出较高的准确度,为未来的面向任务的对话系统提供了对话状态设计的指导。
Aug, 2022
本文提出了一种领域无关的抽取式问答方法用于对话状态跟踪,通过训练一个分类器来预测多个领域的出现情况,将复杂的领域信息进行分离并在活动领域提取跨域问题答案,在多个数据集上达成了优秀的零 - shot 转移模型表现。
Apr, 2022