Mar, 2022

面具视觉预训练用于运动控制

TL;DR本文表明,来自真实世界图像的自监督视觉预训练对于从像素学习运动控制任务是有效的;为了加快像素学习的进展,本文还贡献了一套手工设计的基准任务,其中包括运动、场景和机器人等方面的变化。通过防冻度量的视觉编码器和强化学习,我们实现了与带标签、状态估计或专家演示相比高达 80% 的绝对成功率,有时甚至能与理论最好状态匹敌;还发现,来自 YouTube 或自我中心视频等野外图像,对于各种操作任务的视觉表现比 ImageNet 图像更好。