对话状态跟踪的思维链解释

Mar, 2024

Chain of Thought Explanation for Dialogue State Tracking

Lin Xu, Ningxin Peng, Daquan Zhou, See-Kiong Ng, Jinlan Fu

TL;DR对话状态跟踪（DST）是记录对话交互中用户查询和目标的任务，当前方法透明地决定槽值，而人类通常采用更为深思熟虑的方法，通过收集相关对话回合的信息，然后推理出适当的值。本文提出的 Chain-of-Thought-Explanation（CoTE）模型旨在确定槽值后，逐步创建详细的解释，从而提高槽值的准确性和可靠性。为了提高 CoTE 的推理能力，我们进一步使用自动改写构建了更流畅和高质量的解释，即 CoTE-refined 方法。在三个公认的 DST 基准（MultiWOZ 2.2、WoZ 2.0 和 M2M）上进行的实验证实了 CoTE 的显著有效性。此外，通过细致的细粒度分析，我们发现 CoTE 在长对话回合、用户回应和推理步骤有较为明显的益处。

Abstract

dialogue state tracking (DST) aims to record user queries and goals during a conversational interaction achieved by maintaining a prede- fined set of slots and their corresponding values. Current approaches decide slot

dialogue state tracking chain-of-thought-explanation slot values generative dst framework reasoning ability

发现论文，激发创造

对话状态跟踪的交互槽对比学习对话状态蒸馏网络

本文提出一种 Dialogue State Distillation Network（DSDN）用于进行任务导向的对话系统中的 Dialogue State Tracking（DST），并且在 MultiWOZ 2.0 和 MultiWOZ 2.1 数据集上实验证明，该网络可以动态地利用先前的对话状态并避免引入误差传播，同时还可以有效地捕捉来自对话语境的插槽共同更新关系

Feb, 2023

超越粒度：基于多角度对话协同选择的对话状态跟踪

本研究提出了 DiCoS-DST 方法，该方法根据三个角度（与槽名称的显式连接、与当前对话的相关性、隐含提及导向推理）动态选择与各个槽相关的对话内容来更新状态，该方法在多个基准测试数据集上实现了卓越的性能表现。

May, 2022

可扩展的多领域对话状态跟踪

本文介绍了一种基于深度学习的可伸缩的多领域对话状态跟踪方法，通过引入一个新的状态跟踪框架，该框架独立于具体的槽值集合，并将对话状态表示为候选值集合的分布，此方法能够快速适应新领域，提高跨领域和可扩展性。

Dec, 2017

多领域对话状态跟踪中考虑行为的槽 - 值预测

该研究针对对话系统中特定目标和本体的对话状态跟踪模型的可扩展性问题，提出了一种将对话行为融入到对话模型设计中，利用机器阅读理解预测跨域对话状态的方法，并在实验结果中表现出较高的准确度，为未来的面向任务的对话系统提供了对话状态设计的指导。

Aug, 2022

大型本体的鲁棒对话状态跟踪

本研究使用字符串匹配、面向对话的共识消解和其他方法来跟踪对话状态，可正确标识很多在话语中未显式提到但存在的信息，并在 DSTC 4 比赛中表现优异。

May, 2016

MA-DST: 基于多注意力的可扩展对话状态跟踪

本文提出了一种新的架构，利用多粒度的注意力机制来更稳健地编码对话历史和槽的语义，用于实现准确的跨域对话状态跟踪，并在 MultiWoZ 2.1 数据集上将联合目标准确率提高了 5%（绝对值），并在零 - shot 设置下比现有最先进技术提高至多 2%（绝对值）。

Feb, 2020

通过识别相关上下文来改善对话状态跟踪

提出了一种新颖的 DST 框架，它通过有关特定 slot 值更改的过去话语来识别相关历史上下文，并将其与加权系统话语一起使用以确定相关上下文，实验证明该方法在 WoZ 2.0 和 MultiWoZ 2.0 餐厅领域数据集上比先前的 GLAD 模型提高了 2.75％和 2.36％的目标准确性。

Apr, 2019

通过选择性覆盖记忆实现高效对话状态跟踪

该研究提出了一种基于固定大小记忆和有选择的覆盖机制的对话状态跟踪模型，其将 DST 分解为两个子任务，并引导解码器集中于其中一个任务，以提高 DST 性能。

Nov, 2019

一个具有自适应目标的上下文分层注意力网络，用于对话状态跟踪

该研究提出了使用上下文分层关注网络（CHAN）以及自适应目标策略来加强对话状态追踪（DST）模型，解决了文本中存在的关于历史对话、不平衡的 slot 分配、模型上下文表示等问题，实现了具有很大提升的端到端追踪的性能。

Jun, 2020

通过生成式问答实现对话状态跟踪中的零 - shot 泛化

研究了一种基于生成型问答和条件语言模型的不需要本体的 Dialog State Tracking 方法，具有较好的领域迁移效果。

Jan, 2021