BriefGPT.xyz
Ask
alpha
关键词
policy gradient iterations
搜索结果 - 1
自主驾驶的安全多智能体强化学习
本文介绍了一种利用深度强化学习解决自动驾驶问题的方案,不同于其他机器人任务,自动驾驶需要确保功能安全和在多个智能体情境下执行正确的决策,其中的主要挑战包括如何处理多个智能体的不确定行为,以及如何在 “Desires” 策略和难以控制的路径规
→
PDF
8 years ago
Prev
Next