SeqGAN: 带策略梯度的序列生成对抗网络

AAAISep, 2016

SeqGAN: 带策略梯度的序列生成对抗网络

SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient

Lantao Yu, Weinan Zhang, Jun Wang, Yong Yu

TL;DR本文提出了一种名为 SeqGAN 的序列生成框架，该框架将数据生成器建模为强化学习中的随机策略，通过直接执行梯度策略更新来绕过生成器差异化问题，并利用蒙特卡罗搜索将 RL 奖励信号从 GAN 鉴别器传递回中间状态动作步骤。在合成数据和现实世界任务上的广泛实验表明，SeqGAN 比强基线模型有了显著的改进。

Abstract

As a new way of training generative models, generative adversarial nets (gan) that uses a discriminative model to guide the training of the generative model has enjoyed considerable success in generating real-val

generative adversarial nets gan sequence generation rl monte carlo search

发现论文，激发创造

序列生成对抗网络生成多声部音乐

本文提出了一种基于序列生成对抗网络的应用方法 (SeqGAN)，用于创建和捕获音符和和弦的多声部音乐序列的表征，同时利用神经网络从该嵌入式音乐词空间的模拟分布中学习预测序列的分布，实验表明该方法可以稳定地训练 GAN 并创造出具有音乐连贯性且在定量和定性方面均有所提升的音乐序列。

Oct, 2017

用 Gumbel-softmax 分布的 GAN 生成离散元素序列

本文介绍的是使用基于递归神经网络和 Gumbel-softmax 输出分布的生成敌对网络来生成离散元素序列时的表现评估。

Nov, 2016

生成协作网络用于自然语言生成

本文介绍了一种使用协作式判别器架构来生成逼真文本样本的生成合作网络方法，并通过各种有效的解码方案实现了两项主要 NLG 任务的最优结果。

Jan, 2022

SocialInteractionGAN: 多人互动序列生成

本文介绍了 SocialInteractionGAN—— 一种新颖的基于数据驱动的对抗性生成网络框架，其旨在以单模态展示的相互作用为重点，以离散多序列生成问题为基础，以建立在递归编码器 - 解码器生成网络和双流鉴别器之上的方法来处理相互作用的生成问题。实验结果表明，SocialInteractionGAN 能成功地生成以人为中心的高真实感互动动作序列，这对社交机器人或人工头像的设计具有重要应用。

Mar, 2021

无需强化学习的对抗文本生成

本文利用自编码器生成低维度语句向量空间，再用生成对抗网络利用这个空间生成真实文本，与竞争基线相比，经人工审核和 BLEU 分数表明模型可以生成逼真的文本。

Oct, 2018

目标驱动生成对抗网络 (ORGAN) 用于序列生成模型

本研究提出了一种利用生成对抗网络和强化学习相结合的方法，实现对数据生成过程进行度量偏置，提高目标数据质量。通过在分子和音乐生成数据的生成过程中的应用，验证了该方法的有效性。

May, 2017

使用条件序列生成对抗网络提升神经机器翻译

该论文提出了一种将 GANs 应用于 NMT 的方法，其通过生成对抗网络实现机器翻译任务中句子的生成，并使用 BLEU 评估模型表现，实验证明该方法在英德和中英翻译任务上均优于传统的 RNNSearch 和最新的 Transformer 模型。

Mar, 2017

MaskGAN：通过填充提升文本生成质量

该论文介绍了使用生成对抗网络（GANs）作为神经文本生成模型的训练方法，提高生成样本的质量，并通过 actor-critic 条件 GAN 与最大似然方法对比说明了其效果更好。

Jan, 2018

通过泄露信息的对抗训练实现长文本生成

本文提出了一种名为 LeakGAN 的新框架来解决长文本生成中缺乏中间信息的问题，通过引入高级特征来指导生成模型，LeakGAN 在长文本生成和短文本生成任务中都表现出了较好的性能，并且无需监督学习即可隐式地学习句子结构。

Sep, 2017

TextGAIL: 文本生成的生成对抗模仿学习

本文提出一种基于预训练语言模型的文本生成生成对抗性学习框架，采用对比鉴别器和近端策略优化来稳定和改进文本生成性能，实验证明该方法在无条件和有条件文本生成任务上均优于 MLE 基线。

Apr, 2020