Jun, 2023

面向意图的层次强化学习

TL;DR研究使用基于眼动的意图来自动生成子目标,从而提高深度强化学习代理的样本效率。该方法在 Atari 2600 游戏套件中的 Montezuma's Revenge 等长视程罕见奖励任务中得到了验证。