针对各种模拟驾驶操作的深度强化学习自动驾驶的全面培训和评估

Jun, 2023

针对各种模拟驾驶操作的深度强化学习自动驾驶的全面培训和评估

Comprehensive Training and Evaluation on Deep Reinforcement Learning for Automated Driving in Various Simulated Driving Maneuvers

PDF

Yongqi Dong, Tobias Datema, Vincent Wassenaar, Joris van de Weg, Cahit Tolga Kopar...

TL;DR本研究通过实现、评估和比较两种深度强化学习算法（Deep Q-networks 和 Trust Region Policy Optimization）来训练自动驾驶车辆，以及开发和应用奖励函数，并在基于模拟环境的高速公路自动驾驶训练平台中进行评估，结果显示 TRPO 算法在大多数情况下以及将多种驾驶演练和多种路况情况集成于一体的 ComplexRoads 训练环境中效果最佳。

Abstract

Developing and testing automated driving models in the real world might be challenging and even dangerous, while simulation can help with this, especially for challenging maneuvers. →

automated driving simulation deep reinforcement learning reward functions highway-env

发现论文，激发创造

自主驾驶的深度强化学习：一份综述

本文综述了深度强化学习算法在自动驾驶任务上的应用，包括分类、验证、测试和强化现有强化学习算法解决方案的方法，还介绍了相关领域和挑战。

Feb, 2020

基于深度强化学习的环形交叉口安全、高效、舒适、节能自动驾驶

研究采用深度强化学习算法，设计了行驶状态、行动空间和奖励函数，评估了 Deep Deterministic Policy Gradient (DDPG)，Proximal Policy Optimization (PPO) 和 Trust Region Policy Optimization (TRPO) 等算法在自动驾驶通过环形道路方面的表现，并建立了评估方法，实验结果表明 TRPO 算法在安全性和效率方面优于 DDPG 和 PPO，而 PPO 在舒适水平方面表现最佳，审视了模型对其他驾驶场景的适应性和稳健性。

Jun, 2023

基于深度强化学习的 CARLA 模拟自动驾驶

本论文基于强化学习（RL）与 Deep Q-Learning 框架以及 CARLA 仿真环境，探索了一种实现自动驾驶车辆在高速行驶时保持车道并避让其他车辆的策略，以提高交通安全性。

Jun, 2023

自主驾驶的深度强化学习

本研究旨在利用深度确定性策略梯度算法来应对自主驾驶中复杂的状态和行动空间，我们选择 The Open Racing Car Simulator (TORCS) 来模拟实验环境，并选择适宜的传感器信息设计奖励机制并建立 DPPG 模型，实验结果表明模型在多种场景下均取得了良好的效果。

Nov, 2018

安全导航：在 CARLA 中使用深度强化学习进行自主车辆训练

自主驾驶汽车使用深度强化学习技术在不确定环境中进行决策，通过使用 CARLA 模拟器在真实城市环境中训练和测试自动驾驶模型，实现了准确的对象识别和距离估计以及有效的交通导航。

Oct, 2023

基于深度强化学习的实际驾驶环境离散控制

本篇研究提出了一个基于真实驾驶环境的 MDP 框架，使用多智能体学习算法来实现对自动驾驶车辆的训练，并提出了可靠的初始化、数据增强和训练技术来实现最小化的视频数据和培训，最终在 TORCS 虚拟驾驶环境中得到了验证。

Nov, 2022

自主驾驶的深度强化学习框架

研究利用深度强化学习提出了一个用于自动驾驶的框架，其中包含了包含循环神经网络的信息集成和关注模型用于减少嵌入式硬件的计算复杂度，并在 TORCS 仿真器中验证了其自主操纵能力

Apr, 2017

车辆轨迹控制的高效数据深度强化学习

采用数据高效的深度强化学习方法研究车辆轨迹控制，发现新的模型推理方法并将动力学预测和车辆定位分离，比传统方法更高效地学习控制策略。

Nov, 2023

端到端深度强化学习实现车道保持辅助

本文提出了不同的深度强化学习方法用于自动驾驶，分别包括离散行动类别中的深度 Q 网络算法 (DQN) 和连续行动类别中的深度确定性演员 - 评论家算法 (DDAC)，并在 TORCS 模拟器中测试了其性能。

Dec, 2016

深度强化学习在道路交通路口驾驶中的自我意识安全性

本研究通过引入注意力机制的自我感知模块，根据碰撞率、成功率、停滞率和总奖励等四个指标，对交叉口和环岛等复杂路口环境下的自主驾驶深度强化学习模型进行安全性能评估，并发现引入自我感知模块的 DQN 可显著提高安全表现。

Jan, 2022