Jul, 2015

深度强化学习的大规模并行方法

TL;DR本文介绍了第一个大规模分布式深度强化学习的架构,使用Parallel Actors、Parallel Learners、分布式神经网络和分布式体验存储等四个主要组件,在 Atari 2600 游戏中应用 Deep Q-Network 算法,获得了 41 个游戏的超越性能,并在大多数游戏中缩短了达成这些结果所需的时间。