Feb, 2018

IMPALA: 基于重要性加权的 Actor-Learner 结构的可扩展分布式深度强化学习

TL;DR使用一种新的分布式代理 IMPALA(Importance Weighted Actor-Learner Architecture),在 DMLab-30 和 Atari-57 的环境下进行多任务强化学习,并展示了其成功的性能和多任务学习的积极转移效果。