May, 2019

学习潜在状态表示以加速探索

TL;DR通过先前的经验来学习有效的隐藏表示,以指示探索的区域,这对高维空间中的探索尤其有益。