对话状态追踪:分类还是生成?
提出了一种基于特征值生成的新颖对话状态追踪框架 (SVAG),将 DST 分解为状态值的生成和领域槽的生成,并使用自我训练来进一步改善状态值的生成。实验证明,在模型参数限制在 1000 亿以下的情况下,该方法在数据比例为 5%、10%和 25%的 MultiWOZ 2.1 数据集上取得了最新的性能,与拥有 1000 亿以上的参数的模型相比,SVAG 仍然取得了有竞争力的结果。
Jan, 2024
本文提出了一种可转移的对话状态生成器 (TRADE),其使用复制机制从话语中生成对话状态,实现了在推断过程中跨领域知识转移。通过零样本和小样本模拟跟踪未见领域,TRADE 实现了 60.58%的联合目标精确度,而不影响已经训练过的领域。
May, 2019
StateNet 是一种通用的对话状态跟踪器,它独立于值的数量,共享所有插槽的参数,并使用预训练的词向量而不是明确的语义字典来解决当前方法在大型对话域上难以扩展的挑战,并且在两个数据集上的实验显示,我们的方法不仅克服了这些限制,而且还显著优于最先进的方法的性能。
Oct, 2018
本文提出了全局 - 局部自我关注对话状态跟踪器 (GLAD),通过全局和局部模块结合学习用户语句和前一个系统动作的表示,实现对任务导向对话系统中用户目标和请求的状态估计,有效跟踪了罕见状态,并在 WoZ 和 DSTC2 状态跟踪任务中取得了领先水平。
May, 2018
在复杂环境下,基于多轮对话语境的对话系统中,分析当前最先进系统的错误行为对于解决非分类槽值错误问题、改善语音到文本转录并帮助对话状态跟踪生成模型是至关重要的。
Nov, 2023
本文提出了一种基于 BERT 模型的 GOaL-Oriented 多任务对话状态跟踪器(GOLOMB),该模型通过查询对话历史记录中的槽口和服务的描述以及可能的槽口值来传输多域对话中的槽口值,并具有扩展到未见过的槽口类型的能力。我们的模型在 SGD 数据集上取得了 53.97%的联合目标准确率,优于基线模型。
Feb, 2020
本文提出了一种基于神经网络的半监督显式对话状态跟踪器(SEDST),并利用 CopyFlowNet 表示一个显式的对话状态,并引入后验正则化策略进行间接监督。实验表明,我们的模型在任务导向和非任务导向的对话数据集上均取得了明显的优势。
Aug, 2018
本研究针对任务导向对话系统中对话状态跟踪方法的错误传播问题,提出了一种新的、可编辑生成的对话状态跟踪方法 (AG-DST),其中包含两次生成过程,通过额外的修订生成过程来修正原始对话状态中存在的错误。实验表明,AG-DST 方法显著优于现有方法,在 MultiWOZ 2.2 和 WOZ 2.0 数据集上均取得了最新的性能。
Oct, 2021
本文介绍了一种新的混合架构,将 GPT-2 与来自 Graph Attention Networks 的表示相结合,以实现逐步预测插槽值,并捕获跨域的插槽之间的关系和依赖关系,以提高多域会话跟踪的性能。该模型通过图模块捕获插槽之间的相互依赖性并提高了跨多个域常见的值的预测。
Apr, 2021
本文提出了一种基于 BERT 的零 - shot 自然语言理解模型,用于实现多领域会话状态跟踪,实验结果显示该模型较基线系统具有显著改进。
Jun, 2020