Sep, 2018

使用竞争式强化学习进行 Atari 游戏之间的视觉迁移

TL;DR该论文探讨了使用深度强化学习智能体将知识从一个环境转移到另一个环境的方法,其中使用异步优势演员 - 评论家架构来使用在 Atari 中训练的代理来将目标游戏进行泛化,并使用多个代理在视觉映射 transferred targets 的基础上训练模型,以提高性能、数据效率和稳定性。该架构的功能在 OpenAI gym 中的 Atari 游戏 Pong-v0 和 Breakout-v0 中进行了演示。