基于深度强化学习的环形交叉口安全、高效、舒适、节能自动驾驶

Jun, 2023

基于深度强化学习的环形交叉口安全、高效、舒适、节能自动驾驶

Safe, Efficient, Comfort, and Energy-saving Automated Driving through Roundabout Based on Deep Reinforcement Learning

Henan Yuan, Penghui Li, Bart van Arem, Liujiang Kang, Yongqi Dong

TL;DR研究采用深度强化学习算法，设计了行驶状态、行动空间和奖励函数，评估了 Deep Deterministic Policy Gradient (DDPG)，Proximal Policy Optimization (PPO) 和 Trust Region Policy Optimization (TRPO) 等算法在自动驾驶通过环形道路方面的表现，并建立了评估方法，实验结果表明 TRPO 算法在安全性和效率方面优于 DDPG 和 PPO，而 PPO 在舒适水平方面表现最佳，审视了模型对其他驾驶场景的适应性和稳健性。

Abstract

Traffic scenarios in roundabouts pose substantial complexity for automated driving. Manually mapping all possible scenarios into a state space is labor-intensive and challenging. deep reinforcement learning (DRL)

automated driving deep reinforcement learning roundabouts safety efficiency

发现论文，激发创造

针对各种模拟驾驶操作的深度强化学习自动驾驶的全面培训和评估

本研究通过实现、评估和比较两种深度强化学习算法（Deep Q-networks 和 Trust Region Policy Optimization）来训练自动驾驶车辆，以及开发和应用奖励函数，并在基于模拟环境的高速公路自动驾驶训练平台中进行评估，结果显示 TRPO 算法在大多数情况下以及将多种驾驶演练和多种路况情况集成于一体的 ComplexRoads 训练环境中效果最佳。

Jun, 2023

深度强化学习在道路交通路口驾驶中的自我意识安全性

本研究通过引入注意力机制的自我感知模块，根据碰撞率、成功率、停滞率和总奖励等四个指标，对交叉口和环岛等复杂路口环境下的自主驾驶深度强化学习模型进行安全性能评估，并发现引入自我感知模块的 DQN 可显著提高安全表现。

Jan, 2022

基于强化学习的基于排队的环形交叉口节能驾驶

我们研究了环城路口的生态驾驶在混合交通中如何提高交通流量和交通效率。我们发展了基于规则和基于强化学习的两种生态驾驶系统，并通过对比它们的性能发现，强化学习并没有明显优势，尤其是在高交通量或低连接车辆渗透率下。

May, 2024

自主驾驶的深度强化学习

本研究旨在利用深度确定性策略梯度算法来应对自主驾驶中复杂的状态和行动空间，我们选择 The Open Racing Car Simulator (TORCS) 来模拟实验环境，并选择适宜的传感器信息设计奖励机制并建立 DPPG 模型，实验结果表明模型在多种场景下均取得了良好的效果。

Nov, 2018

基于邻近政策优化的深度强化学习自动换道策略

这篇论文研究了如何利用无人驾驶中的深度强化学习技术来优化车辆变道的策略，通过使用近端策略优化来提高学习效率和性能表现，进一步验证了该策略的有效性和安全性。

Feb, 2020

混合交通合作车道变换的深度强化学习算法性能比较

协同车道变换机制在考虑人工驾驶车辆的不确定性和人车之间的微观交互作用的基础上，利用最先进的深度强化学习算法，通过性能比较证明了 PPO 算法在安全性、效率性、舒适性和生态性等方面具有更好的性能，为 CAV 的车道变换规划带来了更大的优势。

Jun, 2024

自动驾驶车辆的强化学习策略的定量与定性评估

优化自动驾驶车辆的交通动态是至关重要的，本文通过采用强化学习算法 —— 近端策略优化（PPO），得出用于最小化交通拥堵和污染的自动驾驶车辆选择的新方法，并通过实证分析证明该方法可以降低时间和污染水平。

Sep, 2023

智能交通系统中的交通灯深度强化学习控制

本篇论文通过研究深度强化学习在交通灯控制问题中的应用，证明在格网路网中智能行驶的 “绿波” 策略自然而然地出现，并且优于传统方法，这为提高交通效率提供了途径。

Feb, 2023

基于策略深度强化学习和智能路由的自主车辆交通管理

提出了一种基于深度强化学习的信号控制系统，该系统可以根据交通状况动态调整信号并使用重新路由技术平衡道路网络上的车辆，以帮助优化交通流的管理和减少拥堵。

Jun, 2022

交通优化中的隐式感知：先进的深度强化学习技术

通过采用深度强化学习从事自主驾驶车辆上的车辆跟随和变道模型，本论文探讨了解决构成道路阻塞的突发情况，提出了基于 Markov 决策过程和 MEC 辅助架构的综合决策控制系统，并通过 SUMO 模拟器和 OPENAI GYM 评估了该模型的性能，结果显示使用 ε-greedy 策略进行训练的 DQN 代理明显优于使用 Boltzmann 策略进行训练的代理。

Sep, 2023