Nov, 2016

GPU 上异步优势行动者 - 评论家强化学习

TL;DR介绍了一个混合 CPU/GPU 版本的异步优势 Actor-Critic(A3C)算法,分析了它的计算特性并集中讨论了借助 GPU 计算能力的关键方面,通过引入队列系统和动态调度策略,提高了算法效率;基于 TensorFlow 的混合 CPU/GPU 版本实现较 CPU 版本有着显著的加速。