划分、征服和组合：零样本对话状态跟踪的不受语义限制专家混合

Jun, 2023

划分、征服和组合：零样本对话状态跟踪的不受语义限制专家混合

Divide, Conquer, and Combine: Mixture of Semantic-Independent Experts for Zero-Shot Dialogue State Tracking

Qingyue Wang, Liang Ding, Yanan Cao, Yibing Zhan, Zheng Lin...

TL;DR本文提出了一种简单有效的“划分、攻克和合并”解决方案，明确解开已知数据的语义，并利用专家的混合机制来提高零-shot DST性能和鲁棒性。在T5-Adapter上对MultiWOZ2.1进行的大量实验表明，该架构显着且持续地提高了零-shot性能，在没有外部知识的情况下，只需10M可训练参数，实现了SOTA。

Abstract

zero-shot transfer learning for dialogue state tracking (DST) helps to handle a variety of task-oriented dialogue domains without the cost of collecting in-domain data. Existing works mainly study common data- or

发现论文，激发创造

面向任务的对话系统可转移的多领域状态生成器

本文提出了一种可转移的对话状态生成器(TRADE)，其使用复制机制从话语中生成对话状态，实现了在推断过程中跨领域知识转移。通过零样本和小样本模拟跟踪未见领域，TRADE 实现了60.58％的联合目标精确度，而不影响已经训练过的领域。

May, 2019

使用合成数据进行零样本迁移学习的多领域对话状态跟踪

本文提出了一种采用零样本迁移学习的技术，通过从域本体和抽象对话模型中合成所有域内训练数据，对多域对话状态跟踪进行了改进，表明对话状态跟踪中的数据增强可以提高TRADE模型和基于BERT的SUMBT模型在MultiWOZ2.1数据集上零样本学习的准确性，并表明只用合成的域内数据对SUMBT模型进行训练，可以达到全局数据集训练的2/3的准确度，文章的方法还提高了领域之间的平均零样本学习水平达到21%

May, 2020

通过跨任务转移实现零样本对话状态跟踪

本论文提出了TransferQA，一个可转移的生成式问答模型，它通过文本到文本转换框架无缝地结合了抽取式问答和多选式问答，有效地处理了零-shot DST任务中的分类和非分类插槽，并介绍了两种构建无法回答的问题的有效方法，即负面问题抽样和上下文截断。经过实验证明，在MultiWoz上，我们的方法显著改善了现有的零-shot和少-shot结果，与Schema-Guided Dialogue数据集上的全面训练基线相比，我们的方法在未知领域中表现出更好的泛化能力。

Sep, 2021

使用弱监督和稀疏数据的稳健对话状态跟踪

本文介绍了一个基于 attention mechanism 的迁移学习方法，适用于在训练过程中缺乏丰富人工标注数据的情况下训练 extractive DST 模型，通过两种新颖的输入级 dropout 方法来减轻样本稀疏性的负面影响。我们的实验表明，提出的模型训练策略和架构方法在应对新概念、样本稀疏性等挑战时表现出优越性。

Feb, 2022

选择融合作为零样本对话状态跟踪的知识

本研究提出 CoFunDST，使用域不可知的 QA 数据集培训，通过 T5 预训练语言模型基于候选选项直接生成零样本对话状态。与现有的零样本 DST 方法相比，在 MultiWOZ 2.1 的大多数领域中，我们的模型具有更好的联合目标准确性。

Feb, 2023

零-shot对话状态跟踪的ChatGPT：解决方案还是机会？

我们使用 ChatGPT ，一个通用语言模型，展示了它在零-shot DST 上达到的最先进的表现，并证明了通用模型在专业系统替代方面的能力受到其属性的限制，但我们认为通用模型的语境学习能力很可能成为支持专门的动态对话状态跟踪器开发的有力工具。

Jun, 2023

对话状态跟踪领域自适应的零样本自适应前缀

Prompter提出了一种使用目标领域槽的描述生成动态前缀的方法，从而使得可以在零样本情况下使用前缀调整。该方法在MultiWOZ和SGD基准测试中均优于以前的方法。

Jun, 2023

UNO-DST: 利用无标签数据进行零样本对话状态跟踪

我们将零样本对话状态跟踪转化为少样本对话状态跟踪，通过联合和自我训练方法利用目标域中的无标签数据。该方法通过辅助任务生成槽类型作为主要任务的逆提示，在联合训练期间创建槽值。这两个任务之间的循环一致性使得能够生成和选择未知目标域中的高质量样本，以进行后续的微调。此方法还有助于自动标签创建，从而优化对话状态跟踪模型的训练和微调。我们在零样本场景中的大型语言模型上展示了该方法的有效性，在MultiWOZ的所有领域中，平均联合目标准确率提高了8%。

Oct, 2023

MoPE：无监督会话状态跟踪的前缀专家混合模型

提议使用前缀专家混合（MoPE）建立不同领域中类似插槽之间的联系，从而增强零样本对话状态跟踪（DST）模型在未见领域中的迁移性能，实证结果表明MoPE-DST在MultiWOZ2.1上达到57.13%的联合目标精度和在SGD上达到55.40%的精度。

Apr, 2024

零-shot跨域对话状态跟踪通过双低秩自适应

本研究解决了零-shot对话状态跟踪中系统在新领域中缺乏手动注释或广泛再训练的问题。提出的双低秩自适应架构（DualLoRA）有效整合了对话上下文处理和提示优化，在不增加推理延迟的情况下，提升了模型的性能，展示了显著的跨域改进。

Jul, 2024