多智能体连接自主驾驶的深度强化学习
本文介绍了一种利用深度强化学习解决自动驾驶问题的方案,不同于其他机器人任务,自动驾驶需要确保功能安全和在多个智能体情境下执行正确的决策,其中的主要挑战包括如何处理多个智能体的不确定行为,以及如何在 “Desires” 策略和难以控制的路径规划之间实现平衡。
Oct, 2016
本文介绍了一种使用深度循环多智能体演员 - 评论家框架(R-MADDPG)处理部分可观测设置和有限通信下多智能体协调的方法,并探究了循环效应对团队智能体表现和通信使用的影响。研究结果表明,该框架可以学习随时间变化的依赖关系,处理资源限制,并在智能体之间开发不同的通信模式。
Feb, 2020
本篇研究提出了一个基于真实驾驶环境的 MDP 框架,使用多智能体学习算法来实现对自动驾驶车辆的训练,并提出了可靠的初始化、数据增强和训练技术来实现最小化的视频数据和培训,最终在 TORCS 虚拟驾驶环境中得到了验证。
Nov, 2022
研究利用深度强化学习提出了一个用于自动驾驶的框架,其中包含了包含循环神经网络的信息集成和关注模型用于减少嵌入式硬件的计算复杂度,并在 TORCS 仿真器中验证了其自主操纵能力
Apr, 2017
该论文介绍了一种用于自主车辆内部具有合作和竞争行为的模块化且可并行化的多智能体深度强化学习框架。通过使用 AutoDRIVE 生态系统来培养和部署多智能体强化学习策略,并利用具有独特特性和能力的两个缩小比例的自主车辆平台 Nigel 和 F1TENTH 来开发具有物理准确性和图形逼真性的数字孪生模型。
Sep, 2023
本研究旨在利用深度确定性策略梯度算法来应对自主驾驶中复杂的状态和行动空间,我们选择 The Open Racing Car Simulator (TORCS) 来模拟实验环境,并选择适宜的传感器信息设计奖励机制并建立 DPPG 模型,实验结果表明模型在多种场景下均取得了良好的效果。
Nov, 2018
本论文基于强化学习(RL)与 Deep Q-Learning 框架以及 CARLA 仿真环境,探索了一种实现自动驾驶车辆在高速行驶时保持车道并避让其他车辆的策略,以提高交通安全性。
Jun, 2023
本文提出了不同的深度强化学习方法用于自动驾驶,分别包括离散行动类别中的深度 Q 网络算法 (DQN) 和连续行动类别中的深度确定性演员 - 评论家算法 (DDAC),并在 TORCS 模拟器中测试了其性能。
Dec, 2016
智能驾驶系统应能根据当前环境和车辆状况动态制定适当的驾驶策略,确保系统的安全可靠性。本文介绍了一种适用于复杂和各种场景的安全通用端到端自动驾驶系统(SGADS),该系统结合了变分推断与归一化流,使智能车辆能够准确预测未来的驾驶轨迹,并提出了鲁棒安全约束的制定方法。此外,我们将强化学习与示范结合,以增强智能体的搜索过程。实验结果表明,与现有方法相比,我们的 SGADS 能够显著提高安全性能,在复杂城市场景中展现出强大的泛化能力,并提高智能车辆的训练效率。
Jan, 2024