- ACLSynthDST:少样本对话状态跟踪所需的全部都是合成数据
通过使用大型语言模型 (LLMs),我们提出了一种为 Dialog State Tracking (DST) 定制的数据生成框架,使用对话模板和对话模式,合成自然、连贯、流畅的带有 DST 注释的对话,从而实现了少样本学习,且相较于使用人工 - 检索增强的端到端口语对话模型
我们将先前开发的 SLM 模型应用于语音对话应用中,其中对话状态直接从音频信号中推断,通过检索增强的 SLM(ReSLM)改善了识别领域特定实体的困难,提升了模型性能,特别在对话状态跟踪和具有偏置能力的语音自动识别方面具有广泛适用性。
- 基于提示池的逐步增加分类的对话状态跟踪
我们提出了一种使用提示池方法的持续学习方案,能够在测试中自动识别任务和选择适当的提示,并结合回放缓冲区进一步提高模型性能。
- 语音转文本适配器和语音到实体检索器增强的 LLMs 用于语音理解
本文介绍了一种使用 Speech2Text 适配器的联合语音和语言模型,用于桥接语音和语言表示之间的差距,并改进对话状态跟踪性能(DST),并通过 Speech2Entity 检索器增强了 SLM 的性能。
- EMNLP通过会话机器人访问异构文档
本文介绍了 Doc2Bot,这是一种新型数据集,可用于构建通过会话帮助用户寻找信息的机器。我们提出了三个任务,包括对话状态跟踪,对话策略学习和响应生成,这些任务是具有挑战性且值得进一步研究的。
- EMNLP基于知识的对话状态跟踪
本文提出了一种基于外部编码的对话状态跟踪方法,通过查询相关知识以基于对话上下文信息来预测对话状态,证明在一些场景下,我们的方法比基线表现更优秀,尤其是在少样本学习情况下。
- AAAI使用预训练单模型进行 SIMMC 2.0 的多模态交互
本文介绍了我们在 Dialog State Tracking Challenge 10 上进行的 Situated Interactive MultiModal Conversations 2.0 挑战中的工作和方法,提出了一种结合图像和文 - ACL基于模式感知的多领域对话状态跟踪中的预览、关注和回顾课程学习
本研究介绍了一种基于课程学习和模式结构的任务导向对话框架 ——SaCLog,它已经应用于 WOZ2.0 和 MultiWOZ2.1 数据集中的 dialog state tracking,实现了比 TripPy 和 TRADE 更好的性能。
- MultiWOZ 中的注释不一致性和实体偏倚
本研究针对 MultiWOZ 数据集中 Dialog State Tracking (DST) 这一任务的注释一致性问题进行了研究,并提出了一种自动的纠正方法,通过该方法可以在数据集上进行 7-10%的 JGA 增强。此外,还检测到数据集中 - AAAI生成式对话状态跟踪器中的跨语言可转移性的实证研究
本文研究了多语言预训练 seq2seq 模型在跨语言对话状态追踪中的可转移性,尝试了联合训练、预训练等不同设置,并发现了转化能力较低的问题。
- ACL通过生成式问答实现对话状态跟踪中的零 - shot 泛化
研究了一种基于生成型问答和条件语言模型的不需要本体的 Dialog State Tracking 方法,具有较好的领域迁移效果。
- EMNLP对话状态跟踪的语义表述
采用层次表示的语义分析任务,以实现对话状态跟踪,并通过 TreeDST 数据集的编码器 - 解码器框架实现了比现有技术水平的 DST 方法更好的结果。
- KDD基于 BERT 的快速而健壮的基于模式引导的对话数据集跟踪器
本文介绍了一种基于 BERT 的快速和强健的模型 FastSGT 用于在目标导向对话系统中跟踪对话状态,在实验中,FastSGT 在保持计算和内存消耗效率的同时,显着提高了准确性,并通过数据增强显示了提高准确性的有效性。
- ACL从词汇资源中提取的知识增强单词嵌入
提出了一种用于词向量表示的语义专业化的有效方法,使用传统的词嵌入并应用专业化方法以更好地捕捉单词之间的语义关系,结合来自丰富词汇资源(如 BabelNet)的外部知识,以及使用基于对抗式神经网络及 Wasserstein 距离的后处理专业化 - TripPy: 一种基于三元组复制策略的价值无关神经对话状态跟踪技术
本文提出了一种新的对话状态追踪方法,利用复制机制填充值,并结合跨域共指消解方法来简化任务,同时在各种受欢迎的评估集上实现了超过 55% 的联合目标准确率。
- AAAIMA-DST: 基于多注意力的可扩展对话状态跟踪
本文提出了一种新的架构,利用多粒度的注意力机制来更稳健地编码对话历史和槽的语义,用于实现准确的跨域对话状态跟踪,并在 MultiWoZ 2.1 数据集上将联合目标准确率提高了 5%(绝对值),并在零 - shot 设置下比现有最先进技术提高 - EMNLP基于变分分层对话自编码器的对话状态跟踪数据增强
本文提出了一种名为 Variational Hierarchical Dialog Autoencoder(VHDA)的深度生成模型,用于 goal-oriented dialogs 的任务,它有效地捕获了不同层次和类型的 dialog f - 面向资源受限系统的简单而有效的 BERT 模型用于对话状态跟踪
本文提出一种基于 BERT 的简单而有效的对话状态跟踪模型,避免了当前神经架构通常存在的繁琐和复杂,具有不随本体论规模增长和适用于领域本体动态变化的优点。经实验验证,该模型在标准 WoZ 2.0 数据集上显著优于以往方法,经知识蒸馏压缩后性 - 多域对话状态跟踪中的槽值预测:寻找还是分类?
提出了一种新的双策略对话状态跟踪(Dialog state tracking)方法,该方法采用单个类似 BERT 的阅读理解模型来同时处理分类和非分类插槽,实验证明该方法在两种不同的情境下表现出色,并在干扰性较高的数据集上创造了新的最优性能 - 对话状态跟踪:一种神经阅读理解方法
本研究通过利用注意力机制为基础的神经网络,将对话状态跟踪任务转化为阅读理解问答,利用上下文意义理解对话中不同语境中槽位词语的指代,通过利用上下文单词嵌入的最新进展,并将方法与传统的联合状态跟踪方法相结合,得到了比当前最新技术提高 11.75