Feb, 2023
通过使用说明手册学习玩 Atari,实现读书有用
Read and Reap the Rewards: Learning to Play Atari with the Help of Instruction Manuals
Yue Wu, Yewen Fan, Paul Pu Liang, Amos Azaria, Yuanzhi Li...
TL;DR通过阅读 Atari 游戏开发者发布的指南,提出了 Read and Reward 框架来提高强化学习算法的效率,在 Atari 游戏开发者发布的手册中提取相关信息,然后提供辅助奖励给标准的 A2C RL 代理,取得了在 Atari 环境中稀疏奖励下的 4 款游戏中的表现提高,并且需要比先前最优代理 Agent 57 更少的训练帧。