多域对话状态生成的并行交互网络
本文提出了 Parallel Interactive Network (PIN),用于模拟 ID 和 SF 之间的相互指导关系,以及利用双向和明确的信息交换来提高性能,通过两个基准数据集上的实验,证明了该方法的有效性,并利用预先训练的语言模型 BERT 生成的特征嵌入,实现了所有对比方法中的最先进技术。
Sep, 2020
本文提出一种 Dialogue State Distillation Network(DSDN)用于进行任务导向的对话系统中的 Dialogue State Tracking(DST),并且在 MultiWOZ 2.0 和 MultiWOZ 2.1 数据集上实验证明,该网络可以动态地利用先前的对话状态并避免引入误差传播,同时还可以有效地捕捉来自对话语境的插槽共同更新关系
Feb, 2023
本文提出了一种新的架构,利用多粒度的注意力机制来更稳健地编码对话历史和槽的语义,用于实现准确的跨域对话状态跟踪,并在 MultiWoZ 2.1 数据集上将联合目标准确率提高了 5%(绝对值),并在零 - shot 设置下比现有最先进技术提高至多 2%(绝对值)。
Feb, 2020
本文提出了一种用于将对话历史转换为线程的对话提取算法,同时采用预训练 Transformer 进行编码并通过注意力层来得到匹配分数,实验表明依赖关系有助于对话上下文的理解,此模型在 DSTC7 和 DSTC8 等任务上的表现优于现有方法。
Oct, 2020
本文探讨了利用关系图与 relational-GCN 图卷积网络构建聊天机器人多域对话跟踪模型的方法,实验结果表明,该方法实现了新的最佳性能,优于使用现有方法提出的深度学习技术的性能。
Oct, 2020
本论文提出了一种多层次融合对话状态跟踪(DST)网络,通过建模每个对话轮次的交互,实现从以往对话历史和当前对话上下文中抽取对话状态信息,进行预测和融合,加强对当前对话状态的跟踪和理解,实验结果表明该模型在 MultiWOZ 2.0 和 MultiWOZ 2.1 数据集上取得了当前领先的 55.03% 和 59.07% 联合灵敏度值。
Jul, 2021
提出了一种名为 BiDeN 的通用对话编码器,用于捕捉对话的时间特征,将预训练语言模型用于编码对话记录是不够充分的,实验证明 BiDeN 在不同的下游任务中都表现出了卓越的效果。
Apr, 2022
本文介绍了一种新的混合架构,将 GPT-2 与来自 Graph Attention Networks 的表示相结合,以实现逐步预测插槽值,并捕获跨域的插槽之间的关系和依赖关系,以提高多域会话跟踪的性能。该模型通过图模块捕获插槽之间的相互依赖性并提高了跨多个域常见的值的预测。
Apr, 2021
本研究提出了 DiCoS-DST 方法,该方法根据三个角度(与槽名称的显式连接、与当前对话的相关性、隐含提及导向推理)动态选择与各个槽相关的对话内容来更新状态,该方法在多个基准测试数据集上实现了卓越的性能表现。
May, 2022
本文提出了一种基于非自回归框架的对话状态跟踪方法 (NADST),能够考虑域和槽之间的潜在依赖关系,优化对话状态预测的完整集合。该方法的非自回归性质不仅可以并行进行解码,大大降低了实时对话响应生成的延迟,而且可以在令牌级别检测槽之间的依赖关系。在 MultiWOZ 2.1 语料库上,我们的模型在所有领域上的联合精度达到了最先进水平,并且我们的模型的延迟比以前的最新技术低一个数量级,尤其当对话历史随时间推移时。
Feb, 2020