使用深度强化学习进行自动速度和车道变更决策

Mar, 2018

使用深度强化学习进行自动速度和车道变更决策

Automated Speed and Lane Change Decision Making using Deep Reinforcement Learning

Carl-Johan Hoel, Krister Wolff, Leo Laine

TL;DR该论文介绍了一种基于深度强化学习的方法，用于自动生成通用决策功能。通过在模拟环境中训练深度 Q 网络代理以处理卡车挂车组合的速度和车道变换决策，并在公路驾驶案例中表明该方法产生的代理匹配或超过了常用的参考模型。为了展示该方法的普适性，通过在对向交通的道路上训练它来训练同样的算法以进行超车案例的测试。此外，还介绍了一种将卷积神经网络应用于表示可互换对象的高级输入的新方法。

Abstract

This paper introduces a method, based on deep reinforcement learning, for automatically generating a general purpose decision making function. A Deep Q-Network agent was trained in a →

deep reinforcement learning decision making simulated environment convolutional neural network highway driving

发现论文，激发创造

利用深度强化学习进行动态和不确定高速公路环境下的自动车道变更决策

研究开发了一个新型仿真环境，采用深度强化学习的方法训练代理人，在动态和不确定的交通环境中实现了一致的性能，并表明所提出的数据驱动方法在嘈杂的环境中表现显著优于完全依赖启发式的方法。

Sep, 2019

DRNet：基于深度强化学习的自动车道变更决策方法

机器学习在自主驾驶车辆的决策制定中优于许多基于规则的方法，我们通过提出一种基于强化学习的框架 'DRNet'，使用深度强化学习 (DRL) 来改进车道切换，并结合安全验证来确保只选择安全动作。

Nov, 2023

交通优化中的隐式感知：先进的深度强化学习技术

通过采用深度强化学习从事自主驾驶车辆上的车辆跟随和变道模型，本论文探讨了解决构成道路阻塞的突发情况，提出了基于 Markov 决策过程和 MEC 辅助架构的综合决策控制系统，并通过 SUMO 模拟器和 OPENAI GYM 评估了该模型的性能，结果显示使用 ε-greedy 策略进行训练的 DQN 代理明显优于使用 Boltzmann 策略进行训练的代理。

Sep, 2023

自主高速公路驾驶的预测决策

本文提出了一种基于预测的深度强化学习决策模型，考虑了周围车辆的操作意图，并使用真实交通数据进行训练。经过模拟测试，结果表明和基于深度强化学习的模型相比，该模型在复杂的高速公路驾驶场景中提高了决策性能，从而减少了碰撞数量，实现了更安全的驾驶。

Sep, 2022

基于邻近政策优化的深度强化学习自动换道策略

这篇论文研究了如何利用无人驾驶中的深度强化学习技术来优化车辆变道的策略，通过使用近端策略优化来提高学习效率和性能表现，进一步验证了该策略的有效性和安全性。

Feb, 2020

通过人类示范辅助强化学习在自动驾驶车道变换中的安全决策

通过将人类驾驶员的决策作为安全演示进行学习，本研究提出的基于强化学习的决策策略在实践中可显著提高自主驾驶汽车的安全性。

Jul, 2022

端到端深度强化学习实现车道保持辅助

本文提出了不同的深度强化学习方法用于自动驾驶，分别包括离散行动类别中的深度 Q 网络算法 (DQN) 和连续行动类别中的深度确定性演员 - 评论家算法 (DDAC)，并在 TORCS 模拟器中测试了其性能。

Dec, 2016

基于深度强化学习的 CARLA 模拟自动驾驶

本论文基于强化学习（RL）与 Deep Q-Learning 框架以及 CARLA 仿真环境，探索了一种实现自动驾驶车辆在高速行驶时保持车道并避让其他车辆的策略，以提高交通安全性。

Jun, 2023

基于深度强化学习的交通场景目标检测算法

该研究提出了一种新颖的主动检测模型，利用深度强化学习来准确地检测实际场景中的交通物体。该模型通过实施自上而下的方法，利用基于 LSTM-CNN 的深度 Q 网络来识别和对齐具有特定交通物体类别的目标区域，并通过有效的环境特征提取。模型集成了历史和当前的动作和观察结果，进行综合分析。所设计的状态空间和奖励函数考虑了时间步长的影响，使得模型在较少的步骤中完成任务。进行的测试展示了该模型在定位交通信号灯和速限标志方面的卓越准确性和性能，突出了深度强化学习基于主动检测模型在交通相关应用中的功效和潜力，强调了其强大的检测能力和有 promising perfo rmance。

Dec, 2023

多智能体深度强化学习中的协作决策方法：混合 Q 学习用于变道

本文提出了一种名为 MQLC 的方法，它通过整合混合价值 Q 网络，同时考虑集体和个体效益，以解决自主车辆路径规划中的车道变换决策问题。通过在观察中整合基于深度学习的意图识别模块并加强决策网络，使多主体系统能够有效地学习并制定最佳决策策略，从而显著提高车道变换的安全性和速度。

Jun, 2024