生产就绪的聊天机器人:生成或提取
本文提出了一种混合神经对话模型,其结合了检索和生成方法的优点,并经实验证明其在 Twitter 和 Foursquare 数据上优于检索方法和生成方法(包括最近提出的基于知识的神经对话模型),这将为构建对话系统提供新的思路。
Apr, 2019
本文提供了一种 3 步程序来开发满足业务要求的对话模型,包括从历史对话中创建模板、使用神经网络建立对话上下文和业务约束,以及通过自我监督和受训者的方法优化模型,并进行实验验证并在人机交互的环境中应用于商业对话。
Oct, 2022
使用预训练的纯文本语言模型,通过建模定时记录的转录文本并使用因果拒绝采样进行解码,我们提出了一种简单但通用的方法来模拟实时互动对话。我们通过两个案例研究(即即时通讯对话和口语交流)展示了该方法的潜力,这些案例研究需要分别以约 30 tok/s 和 20 tok/s 的速率生成文本以保持实时互动。这些功能可以使用相对较少的数据添加到语言模型中,并在商品硬件上运行。
May, 2024
本文针对神经网络模型生成内容不足的对话应用展开了研究,提出了一种全新的、基于数据和知识驱动的神经对话模型,该模型通过同时考虑历史对话和外部 “事实” 来生成更有用的回应,实验证明该方法在开放领域中具有广泛应用前景,相较于基线模型的 Seq2Seq 方法,能够显著提高输出的信息量。
Feb, 2017
客户数据通常保存在数据库系统中,这些系统可以看作是基于规则的知识库,而企业越来越希望从大型预训练语言模型的能力中受益。本技术报告中,我们描述了一个商业规则引擎和一个集成的神经聊天机器人的案例研究,以及这种特定集成模式所带来的控制级别。我们还讨论了研究人员为保持控制和避免最近被称为模型 “幻觉” 的方式的替代方法(包括在其他系统中实现的过去方法)。
Nov, 2023
本研究提出了 Adapter-Bot,一种对话模型,使用不同的适配器触发按需的对话技能,并实现不间断集成和无缝利用多种知识源,通过与现有最先进的对话模型进行比较的自动评估来评估我们的模型。
Aug, 2020
本篇论文介绍了一种新颖的响应生成系统,它可以在大量非结构化的 Twitter 会话上进行端到端的训练。该系统使用神经网络架构来解决在将上下文信息集成到经典统计模型中出现的稀疏性问题,从而允许系统考虑以前的对话话语。我们的动态上下文生成模型相对于基于上下文和非上下文敏感的机器翻译和信息检索基准具有一致的提高。
Jun, 2015