Feb, 2023

通过使用说明手册学习玩 Atari,实现读书有用

TL;DR通过阅读 Atari 游戏开发者发布的指南,提出了 Read and Reward 框架来提高强化学习算法的效率,在 Atari 游戏开发者发布的手册中提取相关信息,然后提供辅助奖励给标准的 A2C RL 代理,取得了在 Atari 环境中稀疏奖励下的 4 款游戏中的表现提高,并且需要比先前最优代理 Agent 57 更少的训练帧。