使用多个答案学习端到端面向目标的对话

Aug, 2018

使用多个答案学习端到端面向目标的对话

Learning End-to-End Goal-Oriented Dialog with Multiple Answers

Janarthanan Rajendran, Jatin Ganhotra, Satinder Singh, Lazaros Polymenakos

TL;DR该研究工作关注基于目标导向的对话系统中的问题，提出了一种使用监督学习和强化学习方法的新方法，并引入了多个有效的下一个话语来评估具有更现实设置的目标导向性对话系统。通过引入多种有效的下一个话语，该文改进了原始bAbI对话任务，现有的端到端神经方法的表现从原始bAbI对话任务的81.5%下降到permuted-bAbI对话任务的30.3%，而其提出的方法则取得了47.3%的准确度。

Abstract

In a dialog, there can be multiple valid next utterances at any point. The present end-to-end neural methods for dialog do not take this i

发现论文，激发创造

端到端目标导向对话学习

本文提出了一个测试平台，以研究在特定场景下end-to-end对话系统的性能，通过实验比较其与手工设计的系统的相似性及差异性。结果表明，end-to-end系统基于记忆网络能够实现目标，但仍存在缺陷。

May, 2016

深度强化学习下面向对话状态跟踪和管理的端到端学习

该论文提出了一个基于Deep Recurrent Q-Networks变体的端到端对话系统框架，使用强化学习与监督学习的混合算法，在20 Questions游戏模拟器上的实验结果表明，该模型优于基线模型，并学习了潜在对话状态的分布式表示。

Jun, 2016

目标驱动和视觉对话系统的全流程优化

本文介绍了一种基于深度强化学习的方法，使用策略梯度算法来优化基于任务且与视觉相关的对话，该方法在通过Mechanical Turk收集的12万个对话数据集上进行了测试，并提供了鼓舞人心的结果，可以解决生成自然对话和在复杂图像中发现特定对象的问题。

Mar, 2017

目标导向对话中的个性化

本文提出了一种基于个人资料的目标导向对话数据集，结合修改内在神经系统结构、使用多任务学习的方法，将个性化应用于对话系统。

Jun, 2017

使用策略梯度的端到端离线目标导向型对话策略学习

本文提出了一种离线强化学习方法，可从未标注的语料库中学习，既可以在话语级别上进行优化又可以在对话级别上进行优化，解决了现有方法对话级别考虑不足的问题，并使用了一种新的奖励函数和在线/离线策略梯度来学习无需在线用户交互或显式状态空间定义的策略。

Dec, 2017

使用最小的人类代理和最大的用户任务成功学习端到端面向目标的对话

该研究提出了一种可端到端训练的神经目标导向对话系统方法，能通过智能地将对话转移给人工服务代理来处理新用户行为。该方法的三个目标是：最大化用户任务成功率，最小化对人工服务代理的负担，并通过人工代理的反馈进行在线学习，以进一步减轻其负担。实验结果表明所提出的方法能够有效实现这些目标。

Jul, 2019

神经助手：联合行动预测、响应生成和潜在知识推理

本文介绍了神经助手：一种基于神经网络模型的任务导向对话系统，该系统采用了外部知识源，并联合生成文本响应和行动预测，以消除信念状态注释的需要，并实现更高的事实准确性和语言生成性能。

Oct, 2019

用于多领域端到端任务导向对话的动态融合网络

研究通过引入共享专有网络和动态融合网络，明确利用多领域数据，提高每个领域和未见过领域的性能，以及在较少训练数据情况下的可移植性，从而为多领域对话的研究提供了一种先进方法。

Apr, 2020

从相关的对话任务中学习端到端的目标导向型对话

本文描述了一种基于元学习的方法，通过选择性地从相关的对话任务数据中学习，使用少量的数据以及来自相关对话任务的数据来训练神经对话系统，从而显著提高了对话任务的准确性。

Oct, 2021

无监督的后置知识注入实现会话目标

本文介绍了一种基于后处理的知识注入技术，该技术从外部源中提取相关知识，并将其合并到对话响应中，实验表明使用这种方法可以在目标导向和基于知识的对话环境中实现更具吸引力和更丰富的对话响应。

Mar, 2022