Oct, 2022

利用潜在空间先验的示范利用

TL;DR本文提出了一种利用演示数据集通过技能学习和序列建模相结合的方法,以学习高层策略的加速方式,其中序列模型形成潜在空间先验,加速了高层策略的学习速度和最终性能。