ICLRNov, 2020

生成对抗模拟器

TL;DR在强化学习中,我们提出了一种无模拟器知识蒸馏的方法,通过重新初始化数据生成器,利用对抗损失来显式地处理每个输出类的多个观察值,以找到尽可能多的实例,从而改进了现有技术在 MNIST、Fashion-MNIST、CIFAR-10 等基准数据集上的学习情况,同时具体解决了涉及多输入模式时的问题。