本论文基于强化学习(RL)与 Deep Q-Learning 框架以及 CARLA 仿真环境,探索了一种实现自动驾驶车辆在高速行驶时保持车道并避让其他车辆的策略,以提高交通安全性。
Jun, 2023
本文介绍了如何使用强化学习方法和深度 Q 网络等算法,使得机器人可以在未知环境中进行自主导航的任务。我们还利用模拟环境对机器人代理的行为和性能进行了验证和分析。
Feb, 2023
本研究通过实现、评估和比较两种深度强化学习算法(Deep Q-networks 和 Trust Region Policy Optimization)来训练自动驾驶车辆,以及开发和应用奖励函数,并在基于模拟环境的高速公路自动驾驶训练平台中进行评估,结果显示 TRPO 算法在大多数情况下以及将多种驾驶演练和多种路况情况集成于一体的 ComplexRoads 训练环境中效果最佳。
本文提出了不同的深度强化学习方法用于自动驾驶,分别包括离散行动类别中的深度 Q 网络算法 (DQN) 和连续行动类别中的深度确定性演员 - 评论家算法 (DDAC),并在 TORCS 模拟器中测试了其性能。
Dec, 2016
本研究提出了 Nav-Q,首个融合量子计算的深度强化学习(Deep Reinforcement Learning)算法,用于自动驾驶车辆的无碰导航(collision-free navigation)问题。通过量子计算方法提高训练性能,无需车辆上的量子硬件设备。实验证明,Nav-Q 在训练稳定性和收敛速度方面超越了传统方法,并且不会对代理的学习策略产生负面影响。与经典方法相比,引入量子组件的模型具有更强的描述能力。此外,使用噪声量子模拟评估了 Nav-Q 的性能,发现量子噪声可以增强代理在训练过程中的探索倾向。
Nov, 2023
使用深层强化学习训练神经网络来实现自动驾驶规划栈中的控制系统,不仅使模拟环境中的自动驾驶汽车能够在没有障碍物的情况下平稳、安全地行驶,在真实世界城市中也能表现出良好的泛化能力。
Jul, 2022
通过采用深度强化学习从事自主驾驶车辆上的车辆跟随和变道模型,本论文探讨了解决构成道路阻塞的突发情况,提出了基于 Markov 决策过程和 MEC 辅助架构的综合决策控制系统,并通过 SUMO 模拟器和 OPENAI GYM 评估了该模型的性能,结果显示使用 ε-greedy 策略进行训练的 DQN 代理明显优于使用 Boltzmann 策略进行训练的代理。
Sep, 2023
基于强化学习的自主导航方法,采用深度 Q 网络(DQN)和近端策略优化(PPO)模型,通过机器人与环境的连续交互和实时反馈奖励信号,对路径规划和决策过程进行优化,提高机器人在未知环境中的导航能力和自适应性。
Jul, 2024
研究该论文中,通过使用基于 Twin Delayed Deep Deterministic Policy Gradient (TD3) 强化学习算法的低成本单一智能体方法,提出了有效解决自动驾驶车辆在复杂 T 字路口中的导航问题,并证明了该方法在 CARLA 模拟平台中表现出稳定、安全且具有改进性能的结果,通过减少旅行延误、碰撞最小化和降低整体成本等方面的优势,在自动驾驶应用中为强化学习提供了有价值的知识,并突出体现了采用单一智能体、低成本方法在解决复杂驾驶场景和进一步推进强化学习算法方面的潜力。
采用数据高效的深度强化学习方法研究车辆轨迹控制,发现新的模型推理方法并将动力学预测和车辆定位分离,比传统方法更高效地学习控制策略。