Nov, 2018

从像素学习潜在动力学规划

TL;DR通过图像学习环境动态、通过快速在线规划选择动作,利用深度计划网络(PlaNet)解决了连续控制任务中的挑战,同时使用的强度模型相对较少。