神经对话生成的对抗学习

Jan, 2017

Adversarial Learning for Neural Dialogue Generation

Jiwei Li, Will Monroe, Tianlin Shi, Sébastien Jean, Alan Ritter...

TL;DR本文提出了一种基于对抗训练的方法用于生成开放领域对话，该系统的对话和人类对话几乎无法区分。作者将问题转化为一个强化学习问题，同时训练一个生成模型和一个鉴别器，用于评估生成的对话是否和人类对话相似，并将鉴别器的输出作为奖励信号，并进一步提出了一种评估模型 - 对抗性评估模型，该模型可避免一系列潜在的问题。实验结果表明，基于对抗训练的系统生成的响应比先前的基线模型更具参考价值。

Abstract

In this paper, drawing intuition from the Turing test, we propose using adversarial training for open-domain dialogue generation: the system is trained to produce sequences that are indistinguishable from human-g

adversarial training open-domain dialogue generation reinforcement learning generative model adversarial evaluation

发现论文，激发创造

对话模型的对抗性评估

研究了使用对抗性损失来评估对话系统生成的对话回复的可行性。通过训练 RNN 区分模型生成的样本和人类生成的样本，发现该方法可能可行，但实际应用中仍存在许多问题。

Jan, 2017

面向任务的神经对话模型的对抗学习

本文介绍了一种使用对抗性学习方法进行奖励估计的强化学习（RL）的任务导向型对话模型，该方法在一个餐厅搜索场景中实现了较高的对话成功率。

May, 2018

对话生成：从模仿学习到逆强化学习

通过采用敌对模仿学习和敌对逆强化学习的方法，提出了一种新的对话生成奖励模型，可用于更精确地指导生成器训练，实验结果表明其有效性。

Dec, 2018

透过对抗学习实现有理据的视觉对话生成

本文提出了一种基于强化学习和生成对抗网络的新方法，结合注意力机制为每个回答生成可解释的理由，从而在保持自然对话的一致性的同时回答正确地回答问题，取得了当前主要基准测试的最先进结果。

Nov, 2017

潜在空间中的对抗学习用于多样对话生成

本文提出了一个基于生成对抗网络的两步框架，通过自编码学习语句的有意义表征，并学习将输入映射到响应表征上，最终将其解码为响应句子，经定量和定性评估证明相对于现有的最先进方法，该模型生成的响应更具流畅性、相关性和多样性。

Nov, 2019

对话策略优化的神经用户模拟器对抗学习

采用对抗训练的用户模拟器能够生成更加真实和多样化的用户行为数据，并用于训练对话系统中的策略，相比于最大似然的模拟器，能够显著提高对话系统的成功率。

Jun, 2023

端到端生成式对话代理的对抗性学习

本文提出了一种新的对话生成对抗学习方法，包括一个新的生成对话模型和基于标记的分类的鉴别器，实现端到端的反向传播训练，并通过自对话进程生成具有更多多样性的对抗训练数据。实验证明，与传统的教师强制训练相比，该对抗方法显著提高了问答无关训练数据的性能。

Nov, 2017

DAL: 双重对抗学习用于对话生成

通过引入对抗生成学习，利用查询生成与回复生成二者之间的对偶，提高回复的多样化，通过模仿人类评委来引导系统生成自然回复的新颖框架 Dual Adversarial Learning 在高质量回复的生成方面取得了很好的效果。

Jun, 2019

无需对抗性学习的引导式对话策略学习

提出了一种将对抗训练分解成两步的方法，通过辅助对话生成器训练鉴别器并将派生的奖励模型整合到一种通用强化学习方法中，以引导对话策略学习。该方法适用于在线和离线强化学习方法，可获得显著的任务成功率，并有将知识从现有领域转移到新领域的潜力。

Apr, 2020

对话系统中基于变分神经语言生成的对抗领域自适应

本研究提出了一种通过对抗训练方法训练基于变分编码器 - 解码器的语言生成器来实现域适应的方法，通过该方法，可以仅使用少量的领域内数据就能够有效地利用源领域中现有的知识来适应其他相关领域。

Aug, 2018