Oct, 2018

变分鉴别器瓶颈:通过限制信息流改进模仿学习,逆强化学习和 GANs

TL;DR通过对鉴别器的信息流进行限制,我们提出了一种称为变分鉴别器瓶颈的简单通用技术,可以在不同的对抗性学习应用领域中实现显着改进,例如动态连续运动控制的模仿学习和图像生成的 GAN 的训练。