MMMar, 2018

深度强化学习的加速方法

TL;DR探究了如何优化现有的深度强化学习算法以适应现代计算机,特别是在 CPU 和 GPU 的组合下使用许多并行模拟器实例进行训练,并建立了一个统一的并行化框架,使用 GPU 加速数据收集和训练,成功地在短短几分钟内使用整个 DGX-1 在 Atari 游戏中学习出成功的策略。