本文介绍了一种利用深度强化学习解决自动驾驶问题的方案,不同于其他机器人任务,自动驾驶需要确保功能安全和在多个智能体情境下执行正确的决策,其中的主要挑战包括如何处理多个智能体的不确定行为,以及如何在 “Desires” 策略和难以控制的路径规划之间实现平衡。
Oct, 2016
本论文基于强化学习(RL)与 Deep Q-Learning 框架以及 CARLA 仿真环境,探索了一种实现自动驾驶车辆在高速行驶时保持车道并避让其他车辆的策略,以提高交通安全性。
Jun, 2023
通过将强化学习与蒙特卡洛树搜索相结合,我们提出了一种方法来增强完全可观察环境下自动停车任务的在线路径规划。通过先前的搜索步骤中综合利用先前的知识,状态评估方法对于在高维空间下的基于采样的规划方法可以提高实时系统中的计算效率。在复杂环境下执行自动停车任务的挑战在于传统的解析方式很难构建坚固但轻量级的启发式引导。为了克服这一限制,我们在路径规划框架下提出了一种强化学习流程和蒙特卡洛树搜索的结合。通过迭代学习状态的值以及从上一个周期的结果中选出的最佳动作样本,我们能够建模给定状态的值估计器和策略生成器。通过这样的方式,我们建立了一种探索与利用之间的平衡机制,加速了路径规划过程,并在不使用人工专家驾驶员数据的情况下保持其质量。
Mar, 2024
该论文介绍了多智能体强化学习在自主移动中的应用,包括行为规划、车辆之间通信、性能提升等方面,并探讨了该领域的一些最新方法和想法。
Mar, 2022
本篇研究提出了一个基于真实驾驶环境的 MDP 框架,使用多智能体学习算法来实现对自动驾驶车辆的训练,并提出了可靠的初始化、数据增强和训练技术来实现最小化的视频数据和培训,最终在 TORCS 虚拟驾驶环境中得到了验证。
Nov, 2022
本文提出了一种简化的车辆微观模拟方法,并使用深度强化学习优化了具有不同车辆组成的六个交通系统的控制策略,发现了类似于波浪消减、交通信号和匝道计量等的多种新行为,并分析了这些行为以获得可解释的控制策略。
Jul, 2022
该论文提出了使用部分可观测马尔可夫博弈来构建具有现实情况的无人驾驶问题,并提供了 MACAD-Gym 平台来进一步研究和开发基于深度强化学习的集成感知、计划和控制算法。
Nov, 2019
该论文介绍了一种用于自主车辆内部具有合作和竞争行为的模块化且可并行化的多智能体深度强化学习框架。通过使用 AutoDRIVE 生态系统来培养和部署多智能体强化学习策略,并利用具有独特特性和能力的两个缩小比例的自主车辆平台 Nigel 和 F1TENTH 来开发具有物理准确性和图形逼真性的数字孪生模型。
Sep, 2023
本文提出了一个在复杂城市自主驾驶场景下使用无模型深度强化学习的框架,并在高清晰度驾驶模拟器中进行了验证。结果表明,与基线相比,我们的方法可以很好地解决任务,且表现显著优异。
Apr, 2019
无人驾驶车辆在巡逻大面积区域时往往需要协同作用。本文提出了一种基于强化的多智能体协作学习方法,通过训练智能体发展出自己的通信协议,在巡逻过程中进行协作。该解决方案通过模拟实验验证,并从多个方面与其他最先进的巡逻解决方案进行比较。
Jan, 2024