BriefGPT.xyz
Ask
alpha
关键词
driving policy
搜索结果 - 2
CVPR
观察学习
提出了一个名为 Learning by Watching (LbW) 的框架,通过间接观察周围车辆的演示来增加驾驶策略的数据量和新颖性,从而实现更加鲁棒的驾驶,快速适应新场景,并且只需要 10 分钟的数据即可达到 82% 的成功率。
PDF
3 years ago
用于自动驾驶的虚拟到现实强化学习
本文提出了一种虚拟到现实的转换网络,使得在虚拟环境中训练的强化学习驾驶策略可在现实世界中适应,实验证明此方法效果显著且为首次成功的案例。
PDF
7 years ago
Prev
Next