May, 2022

在潜空间中通过组合目标实现高效在线微调

TL;DR本文提出了一种名为Planning to Practice(PTP)的方法,旨在解决普适性机器人面临的目标达成困难和训练代价高的问题,通过分解目标化问题和离线增强学习与在线探索相结合的方法,实现对复杂任务的有效训练和解决。