Agent57：超越 Atari 人类基准

Mar, 2020

Agent57: Outperforming the Atari Human Benchmark

Adrià Puigdomènech Badia, Bilal Piot, Steven Kapturowski, Pablo Sprechmann, Alex Vitvitskyi...

TL;DR本文提出了Agent57，这是第一个在57个Atari游戏中超越人类水平的深度强化学习智能体，该智能体通过训练一个神经网络来参数化从探索性到完全利用性的一系列策略，并提出了一种自适应机制来选择优先考虑哪种策略。此外，我们还利用一种新颖的架构参数化形式，使得学习更加一致和稳定。

Abstract

atari games have been a long-standing benchmark in the reinforcement learning (RL) community for the past decade. This benchmark was proposed to test general competency of RL algorithms. Previous work has achieve