Oct, 2018
变分鉴别器瓶颈:通过限制信息流改进模仿学习,逆强化学习和 GANs
Variational Discriminator Bottleneck: Improving Imitation Learning, Inverse RL, and GANs by Constraining Information Flow
Xue Bin Peng, Angjoo Kanazawa, Sam Toyer, Pieter Abbeel, Sergey Levine
TL;DR通过对鉴别器的信息流进行限制,我们提出了一种称为变分鉴别器瓶颈的简单通用技术,可以在不同的对抗性学习应用领域中实现显着改进,例如动态连续运动控制的模仿学习和图像生成的 GAN 的训练。