ICMLMay, 2018

通过图像翻译实现相关强化学习任务的迁移学习

TL;DR通过将视觉迁移任务与控制策略分离,使用不对齐的 GANs 对目标到源域的视觉映射,再使用不完美演示的模仿学习进一步改进,提高了 Deep RL 在 Breakout 合成视觉变体和 Road Fighter 的传输行为中的样本效率和迁移能力。