具备深度强化学习的类人自动驾驶车辆跟随模型

Jan, 2019

具备深度强化学习的类人自动驾驶车辆跟随模型

Human-Like Autonomous Car-Following Model with Deep Reinforcement Learning

Meixin Zhu, Xuesong Wang, Yinhai Wang

TL;DR该研究提出了一种基于深度强化学习的类人自动车跟随规划框架，并通过创新的奖励函数和反应延迟考虑等方法，将人的驾驶行为映射到速度、相对速度和车辆间距离等状态空间，实现了精度更高的自动驾驶策略学习，具有较强泛化能力，可以为智能驾驶算法和交通流模型的发展提供帮助。

Abstract

This study proposes a framework for human-like autonomous car-following planning based on deep reinforcement learning (deep RL). Historical driving data are fed into a simulation environment where an RL agent lea

autonomous car-following deep reinforcement learning human-like behavior policy gradient generalization

发现论文，激发创造

基于强化学习的自动驾驶安全、高效、舒适速度控制

该论文基于深度强化学习提出了一种用于汽车跟随速度控制的模型，通过对车辆速度的控制以最大化累积奖励，实现安全、高效和舒适的车跟随行为，并与实际数据进行了对比，结果表明强化学习方法在无人驾驶系统开发方面具有潜在的贡献。

Jan, 2019

基于深度强化学习的 CARLA 模拟自动驾驶

本论文基于强化学习（RL）与 Deep Q-Learning 框架以及 CARLA 仿真环境，探索了一种实现自动驾驶车辆在高速行驶时保持车道并避让其他车辆的策略，以提高交通安全性。

Jun, 2023

交通优化中的隐式感知：先进的深度强化学习技术

通过采用深度强化学习从事自主驾驶车辆上的车辆跟随和变道模型，本论文探讨了解决构成道路阻塞的突发情况，提出了基于 Markov 决策过程和 MEC 辅助架构的综合决策控制系统，并通过 SUMO 模拟器和 OPENAI GYM 评估了该模型的性能，结果显示使用 ε-greedy 策略进行训练的 DQN 代理明显优于使用 Boltzmann 策略进行训练的代理。

Sep, 2023

自适应自动驾驶：多样驾驶行为的约束强化学习

通过自适应自动驾驶系统（AA）和约束深度强化学习（C-DRL）实现了模拟人类驾驶行为的独特框架，从而减少驾驶员干预的需求。研究以车辆跟随场景为重点，通过规则分类器提取自然驾驶数据并将其分为三种驾驶风格，采用深度神经网络（DNN）回归器预测跟随风格下的人类加速度，并使用 C-DRL 中的软行动者 - 评论家拉格朗日技术来学习人类安全驾驶策略，实验结果表明每个步骤的有效性，规则分类器能够区分驾驶风格，回归模型准确预测加速度，优于传统车辆跟随模型，并且 C-DRL 代理能够学习到适用于不同驾驶风格的最优驾驶策略。

Jul, 2024

城市自主驾驶的无模型深度强化学习

本文提出了一个在复杂城市自主驾驶场景下使用无模型深度强化学习的框架，并在高清晰度驾驶模拟器中进行了验证。结果表明，与基线相比，我们的方法可以很好地解决任务，且表现显著优异。

Apr, 2019

自主驾驶的深度强化学习框架

研究利用深度强化学习提出了一个用于自动驾驶的框架，其中包含了包含循环神经网络的信息集成和关注模型用于减少嵌入式硬件的计算复杂度，并在 TORCS 仿真器中验证了其自主操纵能力

Apr, 2017

使用无模型强化学习在密集交通中驾驶

本研究使用深度强化学习来生成一种连续控制规划方案，让自动驾驶汽车在拥挤的道路上实现车道变换，并与基于模型预测控制算法进行对比测试。

Sep, 2019

一日学车

本研究首次将深度强化学习应用于自动驾驶，通过模型自主探索学习一个仅需单目图像为输入的车道跟踪策略，并采用单一、易于获取的奖励措施：在无安全司机控制下行驶的距离。我们使用连续的、无模型的深度强化学习算法，并在车上执行所有探索和优化过程，为自动驾驶开发了一个新的框架，摆脱了对定义逻辑规则、制图和直接监督的依赖，同时也探讨该方法面对更广泛自动驾驶任务时的挑战和机会。

Jul, 2018

自主驾驶的深度强化学习

本研究旨在利用深度确定性策略梯度算法来应对自主驾驶中复杂的状态和行动空间，我们选择 The Open Racing Car Simulator (TORCS) 来模拟实验环境，并选择适宜的传感器信息设计奖励机制并建立 DPPG 模型，实验结果表明模型在多种场景下均取得了良好的效果。

Nov, 2018

使用深度强化学习在 Gran Turismo Sport 中实现超人类表现

本文提出了一种基于深度强化学习、高保真的物理模拟和课程进展奖励的学习系统，用于 Gran Turismo Sport 自动汽车竞赛，并在超过 50,000 名人类玩家数据集中，实现了超越自带 AI 和人类最快驾驶者的自主赛车性能。

Aug, 2020