- 在高度类别不平衡的情境中创建一个 ASR 错误强健的口语虚拟病人系统,不使用语音数据
本研究提出了一种新的训练方法,该方法可以在单个对话代理中有效地解决测试数据中存在自动语音识别错误和 SLU 训练数据中存在高度类别不平衡问题的问题,并通过 ASR 错误预测器从文本数据中生成口语数据,显著改进了各种字错误率设置下 VP 的意 - 使用预训练的 DNN-HMM 声学 - 语音模型进行端到端口语理解的三模块建模
本研究探讨使用预训练方法改进口语理解(SLU)中的多种模块技术,结合使用音素模型、MTL 技术等方案进行最终优化,成功提高了 intent 的精度。
- 利用释义生成快速启动对话系统
该研究提出了一种基于改写生成的方法,可以减少创建新对话代理所需要的时间和成本,同时提高其性能,使其能够实际与真实用户进行交互。实验证明该方法提高了意图分类模型的泛化能力,有助于在组织范围内规模化部署这项技术。
- ACL使用现成大型语言模型进行意图分类的数据增强
本研究提出了一种基于提示的方法,使用诸如 GPT-3 等预训练语言模型来生成带标签的意图分类的训练数据,与需要对数据生成进行任务特定的 LM 微调的方法相比,该方法不需要超参数调整,即使在训练数据非常缺乏的情况下也适用,并且评估结果表明,当 - 双向联合神经网络用于意图分类和槽填充
本文提出了一种基于 BERT 的双向联合模型,通过 intent2slot 和 slot2intent 两个机制同时优化意图分类和位置填充,达到了当前公开数据集 ATIS(88.6%)和 SNIPS(92.8%)的最好结果,并显著提高了句子 - EMNLP一种显式联合和监督对比学习框架,用于少样本意图分类和槽位填充
本文提出了一种新颖的显式联合和监督对比学习框架,实现了少样本意图分类和词槽填充,通过构建 episode,允许不平衡的数据集。实验证明,该框架在三个公共数据集上都表现出色。
- 半监督少样本意图分类与槽位填充
本文研究如何将对比学习和无监督数据增强应用于少样本学习,以改进自然语言理解中的意图分类和槽位填充任务。在标准的 IC/SF 基准测试中,我们的半监督方法通过在原有监督元学习技术中引入对比损失和数据增强方法,表现出优异的性能,特别是在少样本 - ICML孟加拉会话代理的端到端自然语言理解流水线
本文提出了一种新方法来构建可用于商业助手的孟加拉语聊天机器人,以高度自信地使用孟加拉语和孟加拉语在英语翻译中进行交流,使用 Rasa Open Source Framework,fastText embeddings,Polyglot em - SLU 中意图分类和跨领域检测的泛化增强
该研究提出了一种使用领域正则化模块的方法,仅使用 In-domain 数据培训模型,支持 In-domain 意图分类和 Out-of-domain 检测,并在 4 个数据集上达到了最先进的性能。
- ACL半监督多目标学习方法用于客户联系意图分类
运用域和任务自适应预训练模型 ALBERT 在顾客联系文本上,通过利用未标注数据、进行半监督学习,将多分类问题解决为多任务学习,从而提高了客服意图分类模型的性能。
- EMNLP面向目标对话系统中意图分类和槽位标记对现实世界噪声的鲁棒性研究
通过研究七种噪声类型对话系统中意图分类和槽位标记模型在真实环境中出现的问题,我们设计了一种增加数据的方法来提高模型性能,使得我们能够训练出一个在各种噪声现象下都具有鲁棒性的 IC/SL 模型。
- ACL利用检索到的样本进行少样本意图分类和槽填充
本文探讨了如何在缺乏足够资源的情况下,通过基于检索的方法完成少量样本学习并用于意图分类和填槽任务。我们提出了一种基于跨度级别检索的方法,通过一种新颖的批次 - softmax 目标函数,在相似的具有相同标签的跨度之间学习上下文化表示。我们的 - ProtoDA: 少样本意图分类的高效迁移学习
该研究探讨了在自然语言处理中实用的序列分类任务通常受到目标类别低训练数据可用性的影响,利用原型网络的元学习范式在相关任务集合上进行转移学习来缓解这个问题,并使用数据增强在句子嵌入空间和原型嵌入空间来提高分类性能,相对于 5-shot 和 1 - 自然语言理解中联合意图检测和槽位填充模型调查
本文综述了自然语言理解中重要的两个任务:目的意图分类和词槽填充。特别是联合模型已经成为达到最佳性能的方法,并揭示了两个任务之间的强关系。文章描述了意图分类和词槽填充在趋势、方法、问题、数据集、评估指标、性能、共享任务等方面的研究,其中包括不 - AAAI基于变压器的域外检测中的马氏距离再审视
本文研究了识别出领域外意图的方法,通过对多种上下文编码器和方法进行对比发现,在只使用领域内数据的情况下,基于 Transformer 的编码器 fine-tuning 可以实现更好的性能,而 Mahalanobis 距离与来自 Transf - ACL隐私政策的意图分类和槽填充
本文提出 PolicyIE 数据集,对比两种基准神经方法处理语义意图分类和信息填充。结果表明序列到序列(Seq2Seq)模型在信息填充任务上优于序列标注方法。
- AAAI使用文本到文本转换和强化学习探索流畅的查询重构
通过使用基于策略的 RL 算法和 Query-reformulating text-to-text transformer (QRT5),重新定向查询并针对问题回答生成奖励获取的查询轨迹,从而使得下游中产生更好的答案,并通过不同的下游环境获 - COLING任务导向对话系统中基于神经网络的槽位填充和意图分类新方法综述
本文重点考察了基于神经网络的研究,围绕自然语言理解在对话系统中的应用,着重研究了两个核心问题:slot filling 和 intent classification,并介绍了三种神经网络架构:独立模型、联合模型和迁移学习模型。提出了当前研 - ACL基于实例的含义预测及观测者
本论文旨在提出一种有效的适应新领域的可扩展模型,该模型使用观察者和基于示例的训练方法提高了话语分类模型的概括能力,并实现在银行,CLINC150 和 HWU64 上进行的语言意图识别中,采用以上方法获得了最先进的结果。
- EMNLP基于二值化神经网络的端到端文本分类
本文提出了一种用于意图分类任务的端到端二值化神经网络架构,包括对输入和分类器的二值化。实验结果表明,该架构在三个数据集上实现了具有可比性的结果,并且使用的内存和训练时间相对较少,可以适用于受限的设备。