多域对话状态生成的并行交互网络

EMNLPSep, 2020

多域对话状态生成的并行交互网络

Parallel Interactive Networks for Multi-Domain Dialogue State Generation

Junfan Chen, Richong Zhang, Yongyi Mao, Jie Xu

TL;DR文章提出了一种基于 Parallel Interactive Networks 方法的多域对话状态追踪模型，通过考虑系统和用户话语在同一轮和不同轮之间的依赖关系，利用插槽级别背景信息和分布式复制机制提取更多表达力强的特征，实现追踪对话状态的目的。

Abstract

The dependencies between system and user utterances in the same turn and across different turns are not fully considered in existing multidomain dialogue state tracking (MDST) models. In this study, we argue that the incorporation of these →

multidomain dialogue state tracking dependencies parallel interactive networks slot-level context distributed copy mechanism

发现论文，激发创造

PIN：一种新型并行交互式网络用于口语语言理解

本文提出了 Parallel Interactive Network (PIN)，用于模拟 ID 和 SF 之间的相互指导关系，以及利用双向和明确的信息交换来提高性能，通过两个基准数据集上的实验，证明了该方法的有效性，并利用预先训练的语言模型 BERT 生成的特征嵌入，实现了所有对比方法中的最先进技术。

Sep, 2020

对话状态跟踪的交互槽对比学习对话状态蒸馏网络

本文提出一种 Dialogue State Distillation Network（DSDN）用于进行任务导向的对话系统中的 Dialogue State Tracking（DST），并且在 MultiWOZ 2.0 和 MultiWOZ 2.1 数据集上实验证明，该网络可以动态地利用先前的对话状态并避免引入误差传播，同时还可以有效地捕捉来自对话语境的插槽共同更新关系

Feb, 2023

MA-DST: 基于多注意力的可扩展对话状态跟踪

本文提出了一种新的架构，利用多粒度的注意力机制来更稳健地编码对话历史和槽的语义，用于实现准确的跨域对话状态跟踪，并在 MultiWoZ 2.1 数据集上将联合目标准确率提高了 5%（绝对值），并在零 - shot 设置下比现有最先进技术提高至多 2%（绝对值）。

Feb, 2020

使用对话依赖关系的多轮响应选择

本文提出了一种用于将对话历史转换为线程的对话提取算法，同时采用预训练 Transformer 进行编码并通过注意力层来得到匹配分数，实验表明依赖关系有助于对话上下文的理解，此模型在 DSTC7 和 DSTC8 等任务上的表现优于现有方法。

Oct, 2020

基于状态图的跨领域对话状态跟踪

本文探讨了利用关系图与 relational-GCN 图卷积网络构建聊天机器人多域对话跟踪模型的方法，实验结果表明，该方法实现了新的最佳性能，优于使用现有方法提出的深度学习技术的性能。

Oct, 2020

预测对话状态和对话内容的多级融合对话状态跟踪

本论文提出了一种多层次融合对话状态跟踪（DST）网络，通过建模每个对话轮次的交互，实现从以往对话历史和当前对话上下文中抽取对话状态信息，进行预测和融合，加强对当前对话状态的跟踪和理解，实验结果表明该模型在 MultiWOZ 2.0 和 MultiWOZ 2.1 数据集上取得了当前领先的 55.03% 和 59.07% 联合灵敏度值。

Jul, 2021

回到未来：双向信息解耦网络用于多轮对话建模

提出了一种名为 BiDeN 的通用对话编码器，用于捕捉对话的时间特征，将预训练语言模型用于编码对话记录是不够充分的，实验证明 BiDeN 在不同的下游任务中都表现出了卓越的效果。

Apr, 2022

知识感知图增强的 GPT-2 用于对话状态跟踪

本文介绍了一种新的混合架构，将 GPT-2 与来自 Graph Attention Networks 的表示相结合，以实现逐步预测插槽值，并捕获跨域的插槽之间的关系和依赖关系，以提高多域会话跟踪的性能。该模型通过图模块捕获插槽之间的相互依赖性并提高了跨多个域常见的值的预测。

Apr, 2021

超越粒度：基于多角度对话协同选择的对话状态跟踪

本研究提出了 DiCoS-DST 方法，该方法根据三个角度（与槽名称的显式连接、与当前对话的相关性、隐含提及导向推理）动态选择与各个槽相关的对话内容来更新状态，该方法在多个基准测试数据集上实现了卓越的性能表现。

May, 2022

非自回归对话状态跟踪

本文提出了一种基于非自回归框架的对话状态跟踪方法 (NADST)，能够考虑域和槽之间的潜在依赖关系，优化对话状态预测的完整集合。该方法的非自回归性质不仅可以并行进行解码，大大降低了实时对话响应生成的延迟，而且可以在令牌级别检测槽之间的依赖关系。在 MultiWOZ 2.1 语料库上，我们的模型在所有领域上的联合精度达到了最先进水平，并且我们的模型的延迟比以前的最新技术低一个数量级，尤其当对话历史随时间推移时。

Feb, 2020