Apr, 2022

通过观看YouTube视频学习驾驶:动作条件对比策略预训练

TL;DR本文提出了一种基于相反动态模型和对比策略预训练的方法来为自动驾驶任务预训练策略模型,使用未经筛选的YouTube视频作为数据源,显著提高了强化学习和模仿学习等下游任务的准确性和效率。