智能代理的对抗性对话塑造

Jul, 2023

Adversarial Conversational Shaping for Intelligent Agents

Piotr Tarasiewicz, Sultan Kenjeyev, Ilana Sebag, Shehab Alshehabi

TL;DR通过对抗对话塑造探究了两个模型 —— 生成对抗网络与策略梯度（GANPG）和生成对抗网络每个生成步骤进行奖励的模型（REGS），来提升智能对话代理的性能。讨论了使用不同训练细节（seq2seq 和 transformers）在强化学习框架下的表现。

Abstract

The recent emergence of deep learning methods has enabled the research community to achieve state-of-the art results in several domains including natural language processing. However, the current robocall system

deep learning robocall system conversational agent generative adversarial network reinforcement learning

发现论文，激发创造

使用生成对抗网络进行文本生成的调查

本篇论文介绍了最近使用生成对抗网络进行文本生成的研究和进展，并对基于对抗学习的文本生成的三种可能选择（即 Gumbel-Softmax 分化，强化学习和修改训练目标）进行了综述。

Dec, 2022

生成对抗训练可以提高神经语言模型的表现

本文提出了一种基于生成对抗网络和对抗性训练的正则化方法，可以在神经语言模型中防止过拟合，与常见的对抗性训练方法相比，本方法不需要经过时间的二次反向传播，并且其开销不超过基准方法的 20%。

Nov, 2022

端到端生成式对话代理的对抗性学习

本文提出了一种新的对话生成对抗学习方法，包括一个新的生成对话模型和基于标记的分类的鉴别器，实现端到端的反向传播训练，并通过自对话进程生成具有更多多样性的对抗训练数据。实验证明，与传统的教师强制训练相比，该对抗方法显著提高了问答无关训练数据的性能。

Nov, 2017

神经对话生成的对抗学习

本文提出了一种基于对抗训练的方法用于生成开放领域对话，该系统的对话和人类对话几乎无法区分。作者将问题转化为一个强化学习问题，同时训练一个生成模型和一个鉴别器，用于评估生成的对话是否和人类对话相似，并将鉴别器的输出作为奖励信号，并进一步提出了一种评估模型 - 对抗性评估模型，该模型可避免一系列潜在的问题。实验结果表明，基于对抗训练的系统生成的响应比先前的基线模型更具参考价值。

Jan, 2017

潜在空间中的对抗学习用于多样对话生成

本文提出了一个基于生成对抗网络的两步框架，通过自编码学习语句的有意义表征，并学习将输入映射到响应表征上，最终将其解码为响应句子，经定量和定性评估证明相对于现有的最先进方法，该模型生成的响应更具流畅性、相关性和多样性。

Nov, 2019

对抗学习框架下的多轮对话生成

本文提出了一种对话生成的敌对学习方法，基于条件生成式敌对网络，生成器是修改后的层次循环编码器 - 解码器网络，鉴别器是与生成器共享上下文和词嵌入的字级双向循环神经网络，在 Ubuntu 对话数据集和电影三元组数据集上表现出更好的性能和更长、更丰富、更具相关性的自动生成回应。

May, 2018

对话生成：从模仿学习到逆强化学习

通过采用敌对模仿学习和敌对逆强化学习的方法，提出了一种新的对话生成奖励模型，可用于更精确地指导生成器训练，实验结果表明其有效性。

Dec, 2018

无需强化学习的对抗文本生成

本文利用自编码器生成低维度语句向量空间，再用生成对抗网络利用这个空间生成真实文本，与竞争基线相比，经人工审核和 BLEU 分数表明模型可以生成逼真的文本。

Oct, 2018

EnsembleGAN: 短文本对话检索生成集成模型的敌对学习

在开放领域对话情景中，提出了一种敌对学习框架 ensembleGAN，用于增强检索 - 生成集合模型，该模型由生成器、排名生成器和排名鉴别器组成，通过学习生成更加相关的响应、高质量候选对抗响应、以及真实响应的识别与区分，实现了两种生成器的优点。实验结果表明了 ensembleGAN 在人工和自动评估度量上的优越性。

Apr, 2020

自然语言的对抗生成

本文探讨了使用 GAN 自学习等机制解决自然语言生成中离散输出空间问题；通过实验表明，提出的模型在中文古诗生成数据集上取得了最新的高分，可以生成自由语序和概率性上下文无关语法。此外还介绍了一个条件模型，可根据句子特征生成序列。

May, 2017