基于交易的对话系统的端到端人类水平表现优化
本文介绍一种基于神经网络的端到端可训练的目标导向对话系统,以及一种新的数据收集方法,该方法基于一种新型的管道式 Wizard-of-Oz 框架。该方法可用于开发对话系统,帮助用户在餐厅搜索领域自然地交流并完成任务。
Apr, 2016
本论文提出了一种对话挑战,用于构建端到端的任务完成对话系统,目标是鼓励对话研究社区在标准数据集和统一实验环境上合作和基准测试。在这个特殊的会话中,我们将发布在三个领域(电影票预订,餐厅预订和出租车预订)中的人工注释的对话数据,以及每个领域内内置模拟器的实验平台,用于训练和评估。最终提交的系统将在模拟设置和人类评委的评估下进行评估。
Jul, 2018
Alexa Conversations 是一种新的目标导向对话系统构建方法,它使用基于对 API 和实体的规格的对话模拟器来生成对话,提供了对自然对话现象的支持,并通过减轻开发人员的负担来降低了对话系统的创建成本。
Apr, 2021
本文提出了基于电影领域的一套新任务套件,旨在测试模型回答事实性问题、提供个性化、进行短对话及在 Reddit 上执行自然对话的能力,评估了各种模型在这些任务上的性能表现。
Nov, 2015
本文介绍了 SalesBot 2.0,通过使用大型语言模型的常识知识逐渐缩小闲聊和面向任务的对话之间的差距,构建了一个新的大规模数据集,提供了更加平滑的话题转换和更加接近人类自然性和一致性的对话,对学术研究和商业应用都具有重要价值,并提出了一种框架可以用于生成具有各种目标意图的对话。
Aug, 2023
该研究介绍了一个新的数据集 Taskmaster-1,其中包括 13,215 个基于任务的对话,包括六个领域。数据集包含了更多现实和多样化的对话,使用了两种不同的方法进行数据收集并提供了多个基准模型,其中 API 调用和参数被标记为基于任务的对话系统的研究、开发和设计提供了新的前景。
Sep, 2019
本文介绍了 DailyTalk 这一高质量的会话 TTS 数据集,该数据集包含来自开放领域对话数据集 DailyDialog 的 2534 个对话,并扩展了 LST-CNN-TTS 模型,结果表明 DailyTalk 数据集可用作通用 TTS 数据集,并且基线模型可以表示 DailyTalk 中的上下文信息。
Jul, 2022
使用预训练的纯文本语言模型,通过建模定时记录的转录文本并使用因果拒绝采样进行解码,我们提出了一种简单但通用的方法来模拟实时互动对话。我们通过两个案例研究(即即时通讯对话和口语交流)展示了该方法的潜力,这些案例研究需要分别以约 30 tok/s 和 20 tok/s 的速率生成文本以保持实时互动。这些功能可以使用相对较少的数据添加到语言模型中,并在商品硬件上运行。
May, 2024
本文提出了一个测试平台,以研究在特定场景下 end-to-end 对话系统的性能,通过实验比较其与手工设计的系统的相似性及差异性。结果表明,end-to-end 系统基于记忆网络能够实现目标,但仍存在缺陷。
May, 2016