ICMLOct, 2020

元强化学习中近似超状态空间的探索

TL;DR本文提出了一种名为 HyperX 的方法,利用元学习的奖励机制,通过近似超状态空间来探索,从而解决了在稀疏奖励情况下元训练的任务探索问题。实验证明,HyperX 方法可以更好地元学习,成功地适应新任务。