面向任务的对话系统可转移的多领域状态生成器
本论文提出了一种基于 TRADE 的可转移对话状态生成器,结合简单有效的话语标记技术和双向语言模型的多任务学习模型,旨在解决基线性能在长对话上大幅下降的问题,最终在 MultiWOZ 2.0 数据集上实现了 52.04%的联合目标准确性,相对提高了 7.03%,成为了最新的最先进技术。
Apr, 2020
本文探讨了利用关系图与 relational-GCN 图卷积网络构建聊天机器人多域对话跟踪模型的方法,实验结果表明,该方法实现了新的最佳性能,优于使用现有方法提出的深度学习技术的性能。
Oct, 2020
本文提出了一种采用零样本迁移学习的技术,通过从域本体和抽象对话模型中合成所有域内训练数据,对多域对话状态跟踪进行了改进,表明对话状态跟踪中的数据增强可以提高 TRADE 模型和基于 BERT 的 SUMBT 模型在 MultiWOZ2.1 数据集上零样本学习的准确性,并表明只用合成的域内数据对 SUMBT 模型进行训练,可以达到全局数据集训练的 2/3 的准确度,文章的方法还提高了领域之间的平均零样本学习水平达到 21%
May, 2020
本文提出了一种领域无关的抽取式问答方法用于对话状态跟踪,通过训练一个分类器来预测多个领域的出现情况,将复杂的领域信息进行分离并在活动领域提取跨域问题答案,在多个数据集上达成了优秀的零 - shot 转移模型表现。
Apr, 2022
通过使用分层编解码结构直接生成信念状态序列的方法,我们提出了一种不需要预定义本体列表的对话状态跟踪方法,并在多域和单域对话状态跟踪数据集上进行了实验,取得了最先进的性能。
Sep, 2019
该研究针对对话系统中特定目标和本体的对话状态跟踪模型的可扩展性问题,提出了一种将对话行为融入到对话模型设计中,利用机器阅读理解预测跨域对话状态的方法,并在实验结果中表现出较高的准确度,为未来的面向任务的对话系统提供了对话状态设计的指导。
Aug, 2022
本文介绍了一种基于深度学习的可伸缩的多领域对话状态跟踪方法,通过引入一个新的状态跟踪框架,该框架独立于具体的槽值集合,并将对话状态表示为候选值集合的分布,此方法能够快速适应新领域,提高跨领域和可扩展性。
Dec, 2017
本文提出了一种新的架构,利用多粒度的注意力机制来更稳健地编码对话历史和槽的语义,用于实现准确的跨域对话状态跟踪,并在 MultiWoZ 2.1 数据集上将联合目标准确率提高了 5%(绝对值),并在零 - shot 设置下比现有最先进技术提高至多 2%(绝对值)。
Feb, 2020
本文提出一种基于问题回答的多领域对话状态跟踪方法(DSTQA),并利用动态演化的知识图谱显式地学习(领域、槽)对之间的关系,相较于最新的模型在 MultiWOZ 2.0 和 2.1 数据集上有 5.80%和 12.21%的相对改进,且在领域适应设置中始终优于最先进的模型。
Nov, 2019
本文提出了一种基于内部和外部注意机制的上下文和架构融合网络来编码对话上下文和架构图,能够在 MultiWOZ 2.0 和 MultiWOZ 2.1 基准测试中获得最新的最佳性能的开放词汇 DST。
Apr, 2020