Mar, 2020
Agent57:超越 Atari 人类基准
Agent57: Outperforming the Atari Human Benchmark
Adrià Puigdomènech Badia, Bilal Piot, Steven Kapturowski, Pablo Sprechmann, Alex Vitvitskyi...
TL;DR本文提出了Agent57,这是第一个在57个Atari游戏中超越人类水平的深度强化学习智能体,该智能体通过训练一个神经网络来参数化从探索性到完全利用性的一系列策略,并提出了一种自适应机制来选择优先考虑哪种策略。此外,我们还利用一种新颖的架构参数化形式,使得学习更加一致和稳定。