BriefGPT.xyz
Ask
alpha
关键词
dense on-policy supervision
搜索结果 - 1
ICCV
通过模仿强化学习教练实现端到端城市驾驶
通过强化学习教练,我们的端到端自主驾驶智能体实现了与人类专家水平接近的表现,其能够通过鸟瞰图像实现连续的低级别操作,提供可靠的监督信号,从而在 NoCrash-dense 基准测试和 CARLA LeaderBoard 公共路线方面达到了最
→
PDF
3 years ago
Prev
Next