基于增量式 LSTM 的对话状态跟踪器
本文提出了一种混合会话状态跟踪器,使用可训练口语理解(SLU)来为插槽填充对话系统增强。在模块化结构中,我们通过可微分规则扩展了一些部分,以允许端到端训练,从而使我们的跟踪器可以更好地进行泛化。在 DSTC2 数据集上进行评估,我们的混合跟踪器在 DSTC2 中的四个类别中有三个类别的性能都优于现有的技术,是当前最好的方法之一。
Feb, 2017
StateNet 是一种通用的对话状态跟踪器,它独立于值的数量,共享所有插槽的参数,并使用预训练的词向量而不是明确的语义字典来解决当前方法在大型对话域上难以扩展的挑战,并且在两个数据集上的实验显示,我们的方法不仅克服了这些限制,而且还显著优于最先进的方法的性能。
Oct, 2018
本研究提出一种新的 Goal-oriented dialogue systems 框架,其中的 dialogue state tracker 可适用于 multiple domains,且不需要特定领域的先验知识,预训练的词嵌入技术有助于提高性能。
Nov, 2018
该论文提出了一种用于端到端学习任务导向型对话系统的模型,主要组成部分是一种递归神经网络 (LSTM),该网络将原始对话直接映射到系统动作的概率分布中,并且可以使用有目的、强化两种不同方式的优化方法。
Jun, 2016
本文描述了我们在 DSTC11 中参与的具有极大成功的模型的工程努力,该模型由三个主要模块组成:(1) 自动语音识别误差校正,(2) 基于文本的对话系统用于估计插槽和值,(3) 后处理用于恢复估计的插槽值的错误。我们的实验证明了对于口语对话语料库,使用明确的自动语音识别误差校正模块、后处理和数据增强对于调整基于文本的对话状态跟踪器至关重要。
Aug, 2023
本文提出了一种基于神经网络的半监督显式对话状态跟踪器(SEDST),并利用 CopyFlowNet 表示一个显式的对话状态,并引入后验正则化策略进行间接监督。实验表明,我们的模型在任务导向和非任务导向的对话数据集上均取得了明显的优势。
Aug, 2018
本研究通过利用注意力机制为基础的神经网络,将对话状态跟踪任务转化为阅读理解问答,利用上下文意义理解对话中不同语境中槽位词语的指代,通过利用上下文单词嵌入的最新进展,并将方法与传统的联合状态跟踪方法相结合,得到了比当前最新技术提高 11.75% 的检测精度。
Aug, 2019
本文提出了一种新颖的端到端可训练的神经网络模型,用于处理任务导向的对话系统,该模型将对话状态、API 调用和结构化的知识库查询结果相结合,以成功完成任务导向的对话,并且能够以联合学习为基础,更好地处理对话历史,生成结构良好的系统响应。在餐厅搜索领域的实验结果表明,相比先前的端到端可训练的神经网络模型,我们提出的模型在适当的系统响应生成方面表现更为卓越。
Aug, 2017
本文提出了一项新的多模式对话状态跟踪任务,用于跟踪视频对话中提到的视觉对象的信息;并介绍了 Video-Dialogue Transformer Network (VDTN) 作为实现该任务的基准模型。
Jun, 2022
提出了一种利用预训练词向量进行表示学习的神经信念追踪(Neural Belief Tracking,NBT)框架,用于估计对话中用户的目标,并可以在不使用手工制作语义词典的情况下达到与最先进的模型相同或更好的效果。
Jun, 2016