BotsTalk: 自动化筛选大规模多技能对话数据集的机器源框架
本研究提出了 Adapter-Bot,一种对话模型,使用不同的适配器触发按需的对话技能,并实现不间断集成和无缝利用多种知识源,通过与现有最先进的对话模型进行比较的自动评估来评估我们的模型。
Aug, 2020
使用 Topical-Chat 数据集,我们训练了多个最先进的编码器 - 解码器对话模型,并进行了自动化和人工评估,以帮助在开放领域对话人工智能方面的进一步研究。
Aug, 2023
提出了基于自动化和众包的 Machines Talking To Machines (M2M) 框架,可用于创建面向目标对话的端到端对话代理,该框架可适应特定任务,并能够收集更多不同领域内的对话流,并维持对话时的自然度,同时,提供了一个新的对话语料库,包含 3000 次对话,涵盖了 2 个领域,与流行的对话数据集进行了比较。
Jan, 2018
本文介绍了 SalesBot 2.0,通过使用大型语言模型的常识知识逐渐缩小闲聊和面向任务的对话之间的差距,构建了一个新的大规模数据集,提供了更加平滑的话题转换和更加接近人类自然性和一致性的对话,对学术研究和商业应用都具有重要价值,并提出了一种框架可以用于生成具有各种目标意图的对话。
Aug, 2023
本文介绍了 Schema-Guided Dialogue (SGD) 数据集,包括 16 个领域的 16,000 个多领域对话。SGD 数据集提供了一个具有挑战性的测试平台,可以用于测试任务包括语言理解,位置填充,对话状态跟踪和响应生成。文章也提出了一个基于模式的任务导向对话的范式,尤其是在输入中提供了一组动态的意图和插槽自然的语言描述,提高了对大量服务形态的支持和新服务的快速集成。
Sep, 2019
本研究探讨了几种结合不同能力的机器学习模型,旨在实现一个综合性的对话系统,并提出了一个新的数据集 BlendedSkillTalk,通过比较不同架构和训练方案的表现来分析这些能力如何在自然对话中融合。研究结果表明,相比于单一技能的模型,多任务训练可以更好地提高混合会话的表现,而统一或二阶段方法都可以表现良好,关键在于避免不必要的技能选择偏差或在新任务上进行微调。
Apr, 2020
本文提出使用不断学习的方法,通过与用户进行对话,改进对话系统(chatbots)中按人工规则编译知识库和局限于理解自然语言的能力,提高在多种语言表达和聊天技能方面的用户满意度。
Sep, 2020
本文介绍一种基于神经网络的端到端可训练的目标导向对话系统,以及一种新的数据收集方法,该方法基于一种新型的管道式 Wizard-of-Oz 框架。该方法可用于开发对话系统,帮助用户在餐厅搜索领域自然地交流并完成任务。
Apr, 2016
该论文介绍了一种新颖的、面向亚马逊 Alexa 奖赛的社交机器人,旨在与用户进行友好的谈话,并在各种话题上展开对话。我们提出了一种模块化系统,重点介绍了我们使用人类思维作为数据管理模型的不同数据来源以及我们如何构建和使用自然语言理解和信息检索工具和 API 来扩展我们的知识库。此外,我们描述了我们的半结构化、可扩展的框架,用于构建特定话题的对话流程,并详细说明了我们的对话管理方案和评分机制。最后,我们简要评估了系统的性能,并观察了开放领域社交机器人面临的挑战。
Jan, 2018
研究了具有多种可能响应的对话,并使用多元会话数据集平衡高分歧因素 (10) 和若干次对话 (6),通过选择性分支延续。为了评估多样化生成的不同任务,我们提出了一个简单的评分算法,基于二分图匹配来最佳整合一组多样参考。最终任务是理解听众期望反应的可控制生成任务,利用文本属性从预训练分类器自动诱导多层次预测会话深度的多个语言生成任务的研究。
Feb, 2021