生产就绪的聊天机器人：生成或提取

AAAINov, 2017

生产就绪的聊天机器人：生成或提取

Production Ready Chatbots: Generate if not Retrieve

Aniruddha Tammewar, Monik Pamecha, Chirag Jain, Apurva Nagvenkar, Krupal Modi

TL;DR该研究提出了一个混合模型，结合了神经会话模型和基于规则的图形对话系统，通过聊天对话协助用户安排提醒，该系统相较于基于规则的基准系统表现出显著的改进，并结合了神经生成模型，使其足够稳健以应对实际应用场景。

Abstract

In this paper, we present a hybrid model that combines a neural conversational model and a rule-based graph dialogue system that assists users in

hybrid model neural conversational model rule-based graph dialogue system scheduling reminders real world application

发现论文，激发创造

一种混合检索生成神经对话模型

本文提出了一种混合神经对话模型，其结合了检索和生成方法的优点，并经实验证明其在 Twitter 和 Foursquare 数据上优于检索方法和生成方法（包括最近提出的基于知识的神经对话模型），这将为构建对话系统提供新的思路。

Apr, 2019

部署检索为基础的任务导向对话响应模型

本文提供了一种 3 步程序来开发满足业务要求的对话模型，包括从历史对话中创建模板、使用神经网络建立对话上下文和业务约束，以及通过自我监督和受训者的方法优化模型，并进行实验验证并在人机交互的环境中应用于商业对话。

Oct, 2022

基于相关知识和目标的预测性检索聊天机器人

本文提出了一种新的多任务学习框架，以预测相关知识并通过显式信号来监督其学习，实现知识驱动的主动式对话，从而提高最终响应选择的准确性。

Jul, 2021

将实时互动会话建模为定时记录的转录

使用预训练的纯文本语言模型，通过建模定时记录的转录文本并使用因果拒绝采样进行解码，我们提出了一种简单但通用的方法来模拟实时互动对话。我们通过两个案例研究（即即时通讯对话和口语交流）展示了该方法的潜力，这些案例研究需要分别以约 30 tok/s 和 20 tok/s 的速率生成文本以保持实时互动。这些功能可以使用相对较少的数据添加到语言模型中，并在商品硬件上运行。

May, 2024

神经对话模型

通过序列到序列框架，一种简单的端到端的对话模型方法被提出，在特定的领域和大规模通用领域的数据集上表现出很好的对话效果，并可用于执行常识推理任务。

Jun, 2015

基于知识的神经对话模型

本文针对神经网络模型生成内容不足的对话应用展开了研究，提出了一种全新的、基于数据和知识驱动的神经对话模型，该模型通过同时考虑历史对话和外部 “事实” 来生成更有用的回应，实验证明该方法在开放领域中具有广泛应用前景，相较于基线模型的 Seq2Seq 方法，能够显著提高输出的信息量。

Feb, 2017

混合聊天机器人中的控制

客户数据通常保存在数据库系统中，这些系统可以看作是基于规则的知识库，而企业越来越希望从大型预训练语言模型的能力中受益。本技术报告中，我们描述了一个商业规则引擎和一个集成的神经聊天机器人的案例研究，以及这种特定集成模式所带来的控制级别。我们还讨论了研究人员为保持控制和避免最近被称为模型 “幻觉” 的方式的替代方法（包括在其他系统中实现的过去方法）。

Nov, 2023

适配器机器人：多功能可控对话模型

本研究提出了 Adapter-Bot，一种对话模型，使用不同的适配器触发按需的对话技能，并实现不间断集成和无缝利用多种知识源，通过与现有最先进的对话模型进行比较的自动评估来评估我们的模型。

Aug, 2020

即插即用式对话模型

本文介绍了一种新的控制对话响应生成的方法 —— 插入式方法，其不需要注释对话数据集或精调大规模语言模型，并可以实现高度控制所生成的会话响应的多个方面。

Oct, 2020

基于神经网络的上下文敏感式对话回复生成方法

本篇论文介绍了一种新颖的响应生成系统，它可以在大量非结构化的 Twitter 会话上进行端到端的训练。该系统使用神经网络架构来解决在将上下文信息集成到经典统计模型中出现的稀疏性问题，从而允许系统考虑以前的对话话语。我们的动态上下文生成模型相对于基于上下文和非上下文敏感的机器翻译和信息检索基准具有一致的提高。

Jun, 2015