Jun, 2023

基于深度强化学习的环形交叉口安全、高效、舒适、节能自动驾驶

TL;DR研究采用深度强化学习算法,设计了行驶状态、行动空间和奖励函数,评估了 Deep Deterministic Policy Gradient (DDPG),Proximal Policy Optimization (PPO) 和 Trust Region Policy Optimization (TRPO) 等算法在自动驾驶通过环形道路方面的表现,并建立了评估方法,实验结果表明 TRPO 算法在安全性和效率方面优于 DDPG 和 PPO,而 PPO 在舒适水平方面表现最佳,审视了模型对其他驾驶场景的适应性和稳健性。