Apr, 2023

在运动控制中预训练视觉模型中,策略学习方法并不平等

TL;DR研究了 14 个预先训练的视觉模型对 3 种不同类型的策略学习方法的影响,包括强化学习(RL)、通过行为克隆进行模仿学习(BC)和带有视觉奖励功能的模仿学习(VRF),结果表明预先训练的模型的有效性高度依赖于下游策略学习算法的选择。