BriefGPT.xyz
Ask
alpha
关键词
contrastive policy pretraining
搜索结果 - 1
ECCV
通过观看 YouTube 视频学习驾驶:动作条件对比策略预训练
本文提出了一种基于相反动态模型和对比策略预训练的方法来为自动驾驶任务预训练策略模型,使用未经筛选的 YouTube 视频作为数据源,显著提高了强化学习和模仿学习等下游任务的准确性和效率。
PDF
2 years ago
Prev
Next