BriefGPT.xyz
Ask
alpha
关键词
reward augmented imitation learning
搜索结果 - 1
通过生成式对抗模仿学习建模人类驾驶行为
本文提出一种通过学习真实世界中的驾驶示范数据来学习神经驾驶策略的方法,并使用广义博弈对抗模型进行智能驾驶行为生成,同时介绍了解决多智能体驾驶建模中存在的问题的多智能体模型,并描述了奖赏信号修正的 reward augmented imita
→
PDF
4 years ago
Prev
Next