自主驾驶的深度强化学习

Nov, 2018

Deep Reinforcement Learning for Autonomous Driving

Sen Wang, Daoyuan Jia, Xinshuo Weng

TL;DR本研究旨在利用深度确定性策略梯度算法来应对自主驾驶中复杂的状态和行动空间，我们选择 The Open Racing Car Simulator (TORCS) 来模拟实验环境，并选择适宜的传感器信息设计奖励机制并建立 DPPG 模型，实验结果表明模型在多种场景下均取得了良好的效果。

Abstract

reinforcement learning has steadily improved and outperform human in lots of traditional games since the resurgence of deep neural network. However, these success is not easy to be copied to autonomous driving be

reinforcement learning autonomous driving deep deterministic policy gradient torcs sensor information

发现论文，激发创造

端到端深度强化学习实现车道保持辅助

本文提出了不同的深度强化学习方法用于自动驾驶，分别包括离散行动类别中的深度 Q 网络算法 (DQN) 和连续行动类别中的深度确定性演员 - 评论家算法 (DDAC)，并在 TORCS 模拟器中测试了其性能。

Dec, 2016

自主驾驶的深度强化学习框架

研究利用深度强化学习提出了一个用于自动驾驶的框架，其中包含了包含循环神经网络的信息集成和关注模型用于减少嵌入式硬件的计算复杂度，并在 TORCS 仿真器中验证了其自主操纵能力

Apr, 2017

基于深度强化学习的 CARLA 模拟自动驾驶

本论文基于强化学习（RL）与 Deep Q-Learning 框架以及 CARLA 仿真环境，探索了一种实现自动驾驶车辆在高速行驶时保持车道并避让其他车辆的策略，以提高交通安全性。

Jun, 2023

针对各种模拟驾驶操作的深度强化学习自动驾驶的全面培训和评估

本研究通过实现、评估和比较两种深度强化学习算法（Deep Q-networks 和 Trust Region Policy Optimization）来训练自动驾驶车辆，以及开发和应用奖励函数，并在基于模拟环境的高速公路自动驾驶训练平台中进行评估，结果显示 TRPO 算法在大多数情况下以及将多种驾驶演练和多种路况情况集成于一体的 ComplexRoads 训练环境中效果最佳。

Jun, 2023

自主驾驶的深度强化学习：一份综述

本文综述了深度强化学习算法在自动驾驶任务上的应用，包括分类、验证、测试和强化现有强化学习算法解决方案的方法，还介绍了相关领域和挑战。

Feb, 2020

基于深度强化学习的实际驾驶环境离散控制

本篇研究提出了一个基于真实驾驶环境的 MDP 框架，使用多智能体学习算法来实现对自动驾驶车辆的训练，并提出了可靠的初始化、数据增强和训练技术来实现最小化的视频数据和培训，最终在 TORCS 虚拟驾驶环境中得到了验证。

Nov, 2022

使用深度强化学习在 Gran Turismo Sport 中实现超人类表现

本文提出了一种基于深度强化学习、高保真的物理模拟和课程进展奖励的学习系统，用于 Gran Turismo Sport 自动汽车竞赛，并在超过 50,000 名人类玩家数据集中，实现了超越自带 AI 和人类最快驾驶者的自主赛车性能。

Aug, 2020

自主驾驶的安全多智能体强化学习

本文介绍了一种利用深度强化学习解决自动驾驶问题的方案，不同于其他机器人任务，自动驾驶需要确保功能安全和在多个智能体情境下执行正确的决策，其中的主要挑战包括如何处理多个智能体的不确定行为，以及如何在 “Desires” 策略和难以控制的路径规划之间实现平衡。

Oct, 2016

具备深度强化学习的类人自动驾驶车辆跟随模型

该研究提出了一种基于深度强化学习的类人自动车跟随规划框架，并通过创新的奖励函数和反应延迟考虑等方法，将人的驾驶行为映射到速度、相对速度和车辆间距离等状态空间，实现了精度更高的自动驾驶策略学习，具有较强泛化能力，可以为智能驾驶算法和交通流模型的发展提供帮助。

Jan, 2019

运用深度强化学习解决实际自动驾驶问题

使用深层强化学习训练神经网络来实现自动驾驶规划栈中的控制系统，不仅使模拟环境中的自动驾驶汽车能够在没有障碍物的情况下平稳、安全地行驶，在真实世界城市中也能表现出良好的泛化能力。

Jul, 2022