对话状态追踪：分类还是生成？

EMNLPAug, 2020

Point or Generate Dialogue State Tracker

Song Xiaohui, Hu Songlin

TL;DR本文提出了 Point-Or-Generate Dialogue State Tracker (POGD)，它从两个角度解决对话状态跟踪任务，并在所有插槽之间共享参数以实现知识共享和可扩展性，其子模块的训练过程被制定为一个多任务学习过程以进一步提高其普适性。实验表明，POGD 不仅在 WoZ 2.0 和 MultiWoZ 2.0 数据集上获得了最先进的结果，而且对未知值和新插槽具有良好的泛化性。

Abstract

dialogue state tracking is a key part of a task-oriented dialogue system, which estimates the user's goal at each turn of the dialogue. In this paper, we propose the Point-Or-Generate Dialogue State Tracker (

dialogue state tracking pogd multi-task learning knowledge sharing task-oriented dialogue system

发现论文，激发创造

用于低资源对话状态跟踪的提示学习和自训练的状态值生成

提出了一种基于特征值生成的新颖对话状态追踪框架 (SVAG)，将 DST 分解为状态值的生成和领域槽的生成，并使用自我训练来进一步改善状态值的生成。实验证明，在模型参数限制在 1000 亿以下的情况下，该方法在数据比例为 5％、10％和 25％的 MultiWOZ 2.1 数据集上取得了最新的性能，与拥有 1000 亿以上的参数的模型相比，SVAG 仍然取得了有竞争力的结果。

Jan, 2024

面向任务的对话系统可转移的多领域状态生成器

本文提出了一种可转移的对话状态生成器 (TRADE)，其使用复制机制从话语中生成对话状态，实现了在推断过程中跨领域知识转移。通过零样本和小样本模拟跟踪未见领域，TRADE 实现了 60.58％的联合目标精确度，而不影响已经训练过的领域。

May, 2019

通用对话状态跟踪

StateNet 是一种通用的对话状态跟踪器，它独立于值的数量，共享所有插槽的参数，并使用预训练的词向量而不是明确的语义字典来解决当前方法在大型对话域上难以扩展的挑战，并且在两个数据集上的实验显示，我们的方法不仅克服了这些限制，而且还显著优于最先进的方法的性能。

Oct, 2018

全局 - 本地自注意力对话状态追踪器

本文提出了全局 - 局部自我关注对话状态跟踪器 (GLAD)，通过全局和局部模块结合学习用户语句和前一个系统动作的表示，实现对任务导向对话系统中用户目标和请求的状态估计，有效跟踪了罕见状态，并在 WoZ 和 DSTC2 状态跟踪任务中取得了领先水平。

May, 2018

级联对话状态跟踪模型在口语对话中是否会不适当地发言？

在复杂环境下，基于多轮对话语境的对话系统中，分析当前最先进系统的错误行为对于解决非分类槽值错误问题、改善语音到文本转录并帮助对话状态跟踪生成模型是至关重要的。

Nov, 2023

目标导向的多任务 BERT 对话状态跟踪器

本文提出了一种基于 BERT 模型的 GOaL-Oriented 多任务对话状态跟踪器（GOLOMB），该模型通过查询对话历史记录中的槽口和服务的描述以及可能的槽口值来传输多域对话中的槽口值，并具有扩展到未见过的槽口类型的能力。我们的模型在 SGD 数据集上取得了 53.97％的联合目标准确率，优于基线模型。

Feb, 2020

神经对话生成中的半监督显式状态跟踪

本文提出了一种基于神经网络的半监督显式对话状态跟踪器（SEDST），并利用 CopyFlowNet 表示一个显式的对话状态，并引入后验正则化策略进行间接监督。实验表明，我们的模型在任务导向和非任务导向的对话数据集上均取得了明显的优势。

Aug, 2018

可修改的对话状态跟踪生成

本研究针对任务导向对话系统中对话状态跟踪方法的错误传播问题，提出了一种新的、可编辑生成的对话状态跟踪方法 (AG-DST)，其中包含两次生成过程，通过额外的修订生成过程来修正原始对话状态中存在的错误。实验表明，AG-DST 方法显著优于现有方法，在 MultiWOZ 2.2 和 WOZ 2.0 数据集上均取得了最新的性能。

Oct, 2021

知识感知图增强的 GPT-2 用于对话状态跟踪

本文介绍了一种新的混合架构，将 GPT-2 与来自 Graph Attention Networks 的表示相结合，以实现逐步预测插槽值，并捕获跨域的插槽之间的关系和依赖关系，以提高多域会话跟踪的性能。该模型通过图模块捕获插槽之间的相互依赖性并提高了跨多个域常见的值的预测。

Apr, 2021

基于模式的对话状态追踪挑战赛的 SPPD 系统

本文提出了一种基于 BERT 的零 - shot 自然语言理解模型，用于实现多领域会话状态跟踪，实验结果显示该模型较基线系统具有显著改进。

Jun, 2020