Sep, 2018

PopArt 多任务深度强化学习

TL;DR该研究智能体如何在一次学习过程中掌握多个顺序决策任务。作者们提出一种自适应方法,使每个任务对学习过程的影响基本相同,并在 57 个不同类型的 Atari 游戏中取得了优异的表现,学习了一个超越人类表现的单一训练策略。