Apr, 2023
在运动控制中预训练视觉模型中,策略学习方法并不平等
For Pre-Trained Vision Models in Motor Control, Not All Policy Learning
Methods are Created Equal
TL;DR研究了14个预先训练的视觉模型对3种不同类型的策略学习方法的影响,包括强化学习(RL)、通过行为克隆进行模仿学习(BC)和带有视觉奖励功能的模仿学习(VRF),结果表明预先训练的模型的有效性高度依赖于下游策略学习算法的选择。