基于多智能体深度强化学习的可扩展去中心化协同车队
该论文介绍了一种用于自主车辆内部具有合作和竞争行为的模块化且可并行化的多智能体深度强化学习框架。通过使用 AutoDRIVE 生态系统来培养和部署多智能体强化学习策略,并利用具有独特特性和能力的两个缩小比例的自主车辆平台 Nigel 和 F1TENTH 来开发具有物理准确性和图形逼真性的数字孪生模型。
Sep, 2023
本研究提出了一种基于深度强化学习的自适应编队交叉口控制模型,该模型采用第一到达优先策略和深度 Q 算法来决定车辆通行的优先级和最佳编队大小,该模型相较于现有方法在旅行效率和燃油节省方面表现出卓越的性能。
Jun, 2022
无人驾驶车辆在巡逻大面积区域时往往需要协同作用。本文提出了一种基于强化的多智能体协作学习方法,通过训练智能体发展出自己的通信协议,在巡逻过程中进行协作。该解决方案通过模拟实验验证,并从多个方面与其他最先进的巡逻解决方案进行比较。
Jan, 2024
自动驾驶车辆的编队技术有潜力提高公路上的安全性和燃油效率。本论文介绍了一种用于学习分布式稳定安全控制器的算法,该算法依赖于最近在神经网络稳定性和安全证书方面的发展。通过在仿真和 100 辆车的编队中评估,实验结果表明了该算法和学习控制器的实用性,通过与线性反馈和分布式模型预测控制器的性能进行比较。
Apr, 2024
本文提出了一种去中心化的协作感知方法,基于 Deep Reinforcement Learning 算法,学习一种反向通讯策略,只请求未知信息,最终实现交通物品的最大化感知和最小化信息交流成本的平衡调整。
Dec, 2022
本文介绍了一种利用深度强化学习解决自动驾驶问题的方案,不同于其他机器人任务,自动驾驶需要确保功能安全和在多个智能体情境下执行正确的决策,其中的主要挑战包括如何处理多个智能体的不确定行为,以及如何在 “Desires” 策略和难以控制的路径规划之间实现平衡。
Oct, 2016
自主驾驶车队展现中短期机会以提高运营效率和挽救生命。本文介绍了一个可以评估和基准测试装载传感器的 1/10 比例车辆车队算法的测试平台,通过对典型车队场景进行变速的参考轨迹跟踪的实验,评估了线性反馈和两种分布式模型预测控制算法,并验证了算法的性能随车队规模增加而增加,结果表明分布式模型预测控制算法在硬件和仿真中优于线性反馈。
Feb, 2024
本文提出了一种简化的车辆微观模拟方法,并使用深度强化学习优化了具有不同车辆组成的六个交通系统的控制策略,发现了类似于波浪消减、交通信号和匝道计量等的多种新行为,并分析了这些行为以获得可解释的控制策略。
Jul, 2022
本论文基于强化学习(RL)与 Deep Q-Learning 框架以及 CARLA 仿真环境,探索了一种实现自动驾驶车辆在高速行驶时保持车道并避让其他车辆的策略,以提高交通安全性。
Jun, 2023