Mar, 2018

分布式优先经验回放

TL;DR本文中,我们提出了一个分布式深度强化学习架构,可以使代理能够有效地从数量级更多的数据中学习,其中优先经验回放是实现高性能的关键因素。