Feb, 2023

利用跳跃模型进行机器人领域的规划和快速学习

TL;DR本文研究了从未标记的经验中学习多步动态预测模型(跳跃模型)及其在后续任务中快速推理(高级)计划的实用性。通过离线学习技能嵌入空间,我们提出了一种学习跳跃模型的方法,不需要标签或奖励注释。通过在 RGB 堆栈环境中进行一系列实验,展示了通过学习技能和相关模型进行规划可以实现对新任务的零 - shot 泛化,并且可以通过强化学习进一步加速策略的训练。这些实验表明,结合时间抽象的 jumpy 模型可以促进长视角任务中的规划,这些任务在标准动态模型中难以实现。