IJCAIMay, 2016

动态帧跳跃深度 Q 网络

TL;DR该论文提出了一种新的 Deep Reinforcement Learning 架构,Dynamic Frame skip Deep Q-Network (DFDQN),它使 Frame Skip Rate 成为一个动态可学习的参数,从而能够根据当前状态选择要重复的动作次数,并且成功提高了在 Seaquest 等较难游戏中的表现。