- IJCAI三思而后言:通过计划单次对话来改善多次对话策略
本文提出了一种基于多任务学习框架的 Planning Enhanced Dialog Policy (PEDP) 方法,使用模型规划来模拟单动作对话,从而增强多动作预测,实现了相对于现有状态下最先进方法的 3% 提高,达到了 90.6% 的 - ACL假期去哪里:面向混合类型对话以澄清用户目标
本文提出了一个基于人类混合类型对话语料库的混合式对话模型,其中包含 5k 对话会话和 168k 话语,用于帮助确定用户目标并实现目标,并提供了基于提示的持续学习机制,以帮助模型不断提高其在任何特定类型上的能力。
- Redwood: 使用碰撞检测来构建大规模意图分类数据集
本研究介绍了一种用于检测语义重叠的多个数据集之间的任务 —— 意图碰撞检测,并利用该方法构建和基准测试了一个包含 13 个原始意图分类数据集中的 451 个意图类别的数据集 Redwood,是目前公开提供的最大的意图分类基准数据集之一。
- 利用释义生成快速启动对话系统
该研究提出了一种基于改写生成的方法,可以减少创建新对话代理所需要的时间和成本,同时提高其性能,使其能够实际与真实用户进行交互。实验证明该方法提高了意图分类模型的泛化能力,有助于在组织范围内规模化部署这项技术。
- EMNLP探究对常见比喻语言结构的对话模型的鲁棒性
研究发现现有的对话模型在处理比喻和比拟等修辞语言时存在很大的不足,提出利用外部资源将比喻语言转化为字面意思以提高模型鲁棒性的解决方案。
- EMNLPTIAGE: 面向话题漂移感知的对话建模基准
本研究介绍了一种新的话题转换感知会话基准 TIAGE,其具有检测、触发和对话生成三个任务,实验结果表明,TIAGE 中的话题转移信号对话题转移响应生成有用,但仍需要在话题转换感知对话建模方面进行进一步研究。
- ACL面向语言建模的选择性差分隐私
本文提出了一种新的隐私保护机制 Selective-DPSGD,采用选择性差分隐私保护敏感信息,保证了语言模型和对话系统在隐私攻击下的安全性和效用性。
- 大语言模型的程序综合
本文探索了大型语言模型在通用编程语言的程序合成方面的局限性,并在新的基准测试中评估了这些模型的性能。作者在两个基准测试(MBPP 和 MathQA-Python)上测试了这些模型,结果表明这些模型的性能随着其大小的增加而呈现对数线性关系。他 - 基于模式引导的零 - shot 对话范式
通过显式地提供特定任务对话策略,提出了 Schema Attention Model (SAM) 和改进版 Schema 表示来解决零 - shot 迁移学习问题,在 Star 语料库上验证了 SAM 在零 - shot 模式下的显著改善, - 对话评估指标的全面评估
这篇论文对 23 种不同的自动评估度量在 10 个不同的数据集上进行了评估,并在不同的设置中对其进行了评估,从而更好地确定它们各自的优缺点。综合评估提供了关于对话评估指标的几个认识,为未来的研究提供了有用的指导。
- R-U-A-Robot 数据集:通过检测用户关于人类或非人类身份的问题来帮助避免聊天机器人欺骗
本文探讨了人机交互中系统设计与研究者如何允许系统确认其非人身份,研究了大量针对是否为机器人的表述与系统无法识别的内容,比较了不同分类器识别意图的效率和模型复杂度之间的权衡,提出了避免误导的虚假响应型对话系统的思路,并研究了已经投入使用的系统 - ACL面向情感支持的对话系统
本研究旨在探讨如何在对话系统中建立情感支持,并构建了基于 “Helping Skills Theory” 的 “Emotional Support Conversation(ESC)” 任务和 ESC 框架。同时设计了一个注释丰富的情感支持 - ACL丰富自然语言理解的意图特征
提出从句法线索中学习机器人用户意图特征的思想,旨在提高自然语言理解模型的性能,特别是多意图的分类任务。提出了新的神经网络 Global-Local 模型,可在实际情况下和已有基线相比显着提高性能。
- AAAI学生 - 教师架构在元学习环境下用于对话领域自适应
提出了一种高效的领域自适应任务导向对话系统模型,通过使用元教师模型量化不同领域中上下文下生成的令牌的重要性来指导对话模型,实现更好的自适应效果并达到最先进的性能水平。
- ACL以实践为驱动的评估商业意图检测服务的基准测试
研究比较不同意图检测方法,显示 Watson Assistant 具有高准确度,能较少使用计算资源和训练数据,并在训练和测试分布不同时表现出较高的鲁棒性。
- ACL面向任务的分层 Transformer 对话系统
本文提出了一种广义的分层 Transformer 编码器框架,并通过一系列实验展示了分层编码如何帮助任务导向的对话系统中的 transformer-based 模型更好地理解上下文从而实现更好的自然语言理解。
- ACL基于实例的含义预测及观测者
本论文旨在提出一种有效的适应新领域的可扩展模型,该模型使用观察者和基于示例的训练方法提高了话语分类模型的概括能力,并实现在银行,CLINC150 和 HWU64 上进行的语言意图识别中,采用以上方法获得了最先进的结果。
- EMNLP理解间接回答
本文关注了对话中的一种实用推断问题:理解对问题的间接回答。通过精心的众包,创建并发布了第一个大规模的英语语料库 'Circa',并提出了基于 BERT 的神经模型来预测一对问题 - 答案的类别。结果表明,虽然从蕴涵的传递学习中可以得到合理的 - EMNLP一种概率型端到端任务导向对话模型及其潜在置信状态,用于半监督学习
利用潜变量模型及半监督学习的方法实现对于对话系统中的结构化信念状态的分类,且在三份基准数据集上表现优秀,减少了对于标注数据的需求。
- ACL基于 WikiHow 的意图识别
该论文提出了一套预训练的意图检测模型,该模型通过训练 wikiHow 上的数据,在多语言场景下实现了最先进的结果,并且在零样本和少样本学习上具有较强的性能,即使只使用 100 个训练样本,在所有数据集上达到了超过 75%的准确率。