BotsTalk: 自动化筛选大规模多技能对话数据集的机器源框架

EMNLPOct, 2022

BotsTalk: 自动化筛选大规模多技能对话数据集的机器源框架

BotsTalk: Machine-sourced Framework for Automatic Curation of Large-scale Multi-skill Dialogue Datasets

Minju Kim, Chaehyeong Kim, Yongho Song, Seung-won Hwang, Jinyoung Yeo

TL;DR提出了一种名为 BotsTalk 的新框架，其中多个代理参加交谈以自动注释多技能对话，并展示了一个名为 BSBT 的大规模多技能对话数据集，通过广泛的实验表明，我们的数据集对于需要理解技能融合和技能基础的多技能对话系统非常有效。

Abstract

To build open-domain chatbots that are able to use diverse communicative skills, we propose a novel framework BotsTalk, where multiple agents grounded to the specific target skills participate in a conversation to automatically annotate →

open-domain chatbots botstalk framework multi-skill dialogues skill blending skill grounding

发现论文，激发创造

适配器机器人：多功能可控对话模型

本研究提出了 Adapter-Bot，一种对话模型，使用不同的适配器触发按需的对话技能，并实现不间断集成和无缝利用多种知识源，通过与现有最先进的对话模型进行比较的自动评估来评估我们的模型。

Aug, 2020

Topical-Chat：面向知识驱动的开放域对话

使用 Topical-Chat 数据集，我们训练了多个最先进的编码器 - 解码器对话模型，并进行了自动化和人工评估，以帮助在开放领域对话人工智能方面的进一步研究。

Aug, 2023

使用对话自我博弈，一夜之间构建一个交流代理人

提出了基于自动化和众包的 Machines Talking To Machines (M2M) 框架，可用于创建面向目标对话的端到端对话代理，该框架可适应特定任务，并能够收集更多不同领域内的对话流，并维持对话时的自然度，同时，提供了一个新的对话语料库，包含 3000 次对话，涵盖了 2 个领域，与流行的对话数据集进行了比较。

Jan, 2018

销售机器人 2.0：一个人类化意图导向的闲聊数据集

本文介绍了 SalesBot 2.0，通过使用大型语言模型的常识知识逐渐缩小闲聊和面向任务的对话之间的差距，构建了一个新的大规模数据集，提供了更加平滑的话题转换和更加接近人类自然性和一致性的对话，对学术研究和商业应用都具有重要价值，并提出了一种框架可以用于生成具有各种目标意图的对话。

Aug, 2023

实现可扩展的多领域对话代理: Schema-Guided 对话数据集

本文介绍了 Schema-Guided Dialogue (SGD) 数据集，包括 16 个领域的 16,000 个多领域对话。SGD 数据集提供了一个具有挑战性的测试平台，可以用于测试任务包括语言理解，位置填充，对话状态跟踪和响应生成。文章也提出了一个基于模式的任务导向对话的范式，尤其是在输入中提供了一组动态的意图和插槽自然的语言描述，提高了对大量服务形态的支持和新服务的快速集成。

Sep, 2019

评估对话代理程序整合技能的能力

本研究探讨了几种结合不同能力的机器学习模型，旨在实现一个综合性的对话系统，并提出了一个新的数据集 BlendedSkillTalk，通过比较不同架构和训练方案的表现来分析这些能力如何在自然对话中融合。研究结果表明，相比于单一技能的模型，多任务训练可以更好地提高混合会话的表现，而统一或二阶段方法都可以表现良好，关键在于避免不必要的技能选择偏差或在新任务上进行微调。

Apr, 2020

终身学习对话系统：自学聊天机器人

本文提出使用不断学习的方法，通过与用户进行对话，改进对话系统（chatbots）中按人工规则编译知识库和局限于理解自然语言的能力，提高在多种语言表达和聊天技能方面的用户满意度。

Sep, 2020

基于网络的端到端可训练任务导向式对话系统

本文介绍一种基于神经网络的端到端可训练的目标导向对话系统，以及一种新的数据收集方法，该方法基于一种新型的管道式 Wizard-of-Oz 框架。该方法可用于开发对话系统，帮助用户在餐厅搜索领域自然地交流并完成任务。

Apr, 2016

Slugbot：一种新颖且可扩展的开放域社交机器人框架应用

该论文介绍了一种新颖的、面向亚马逊 Alexa 奖赛的社交机器人，旨在与用户进行友好的谈话，并在各种话题上展开对话。我们提出了一种模块化系统，重点介绍了我们使用人类思维作为数据管理模型的不同数据来源以及我们如何构建和使用自然语言理解和信息检索工具和 API 来扩展我们的知识库。此外，我们描述了我们的半结构化、可扩展的框架，用于构建特定话题的对话流程，并详细说明了我们的对话管理方案和评分机制。最后，我们简要评估了系统的性能，并观察了开放领域社交机器人面临的挑战。

Jan, 2018

MultiTalk: 用于多样对话的高分支对话测试平台

研究了具有多种可能响应的对话，并使用多元会话数据集平衡高分歧因素 (10) 和若干次对话 (6)，通过选择性分支延续。为了评估多样化生成的不同任务，我们提出了一个简单的评分算法，基于二分图匹配来最佳整合一组多样参考。最终任务是理解听众期望反应的可控制生成任务，利用文本属性从预训练分类器自动诱导多层次预测会话深度的多个语言生成任务的研究。

Feb, 2021