强化学习应用于多智能体汽车停车

Jun, 2022

强化学习应用于多智能体汽车停车

Multi-Agent Car Parking using Reinforcement Learning

Omar Tanner

TL;DR本文介绍了应用强化学习解决多智能体汽车停车问题的方法和结果，通过使用独立学习和多智能体通信的马尔可夫决策过程设计实现了灵活的停车环境，结果证明了这种方法的高效性和优越性，并发现了一种合作方式和合作中的漏洞，在自动驾驶和车队管理等领域具有潜在应用。

Abstract

As the industry of autonomous driving grows, so does the potential interaction of groups of autonomous cars. Combined with the advancement of artificial intelligence and simulation, such groups can be simulated,

autonomous driving artificial intelligence reinforcement learning multi-agent car parking

发现论文，激发创造

自主驾驶的安全多智能体强化学习

本文介绍了一种利用深度强化学习解决自动驾驶问题的方案，不同于其他机器人任务，自动驾驶需要确保功能安全和在多个智能体情境下执行正确的决策，其中的主要挑战包括如何处理多个智能体的不确定行为，以及如何在 “Desires” 策略和难以控制的路径规划之间实现平衡。

Oct, 2016

基于深度强化学习的 CARLA 模拟自动驾驶

本论文基于强化学习（RL）与 Deep Q-Learning 框架以及 CARLA 仿真环境，探索了一种实现自动驾驶车辆在高速行驶时保持车道并避让其他车辆的策略，以提高交通安全性。

Jun, 2023

基于强化学习的 MCTS 路径规划在自动停车中的加速

通过将强化学习与蒙特卡洛树搜索相结合，我们提出了一种方法来增强完全可观察环境下自动停车任务的在线路径规划。通过先前的搜索步骤中综合利用先前的知识，状态评估方法对于在高维空间下的基于采样的规划方法可以提高实时系统中的计算效率。在复杂环境下执行自动停车任务的挑战在于传统的解析方式很难构建坚固但轻量级的启发式引导。为了克服这一限制，我们在路径规划框架下提出了一种强化学习流程和蒙特卡洛树搜索的结合。通过迭代学习状态的值以及从上一个周期的结果中选出的最佳动作样本，我们能够建模给定状态的值估计器和策略生成器。通过这样的方式，我们建立了一种探索与利用之间的平衡机制，加速了路径规划过程，并在不使用人工专家驾驶员数据的情况下保持其质量。

Mar, 2024

多智能体强化学习介绍及其在自主移动中的应用综述

该论文介绍了多智能体强化学习在自主移动中的应用，包括行为规划、车辆之间通信、性能提升等方面，并探讨了该领域的一些最新方法和想法。

Mar, 2022

基于深度强化学习的实际驾驶环境离散控制

本篇研究提出了一个基于真实驾驶环境的 MDP 框架，使用多智能体学习算法来实现对自动驾驶车辆的训练，并提出了可靠的初始化、数据增强和训练技术来实现最小化的视频数据和培训，最终在 TORCS 虚拟驾驶环境中得到了验证。

Nov, 2022

强化学习在车载系统中的统一自动控制

本文提出了一种简化的车辆微观模拟方法，并使用深度强化学习优化了具有不同车辆组成的六个交通系统的控制策略，发现了类似于波浪消减、交通信号和匝道计量等的多种新行为，并分析了这些行为以获得可解释的控制策略。

Jul, 2022

多智能体连接自主驾驶的深度强化学习

该论文提出了使用部分可观测马尔可夫博弈来构建具有现实情况的无人驾驶问题，并提供了 MACAD-Gym 平台来进一步研究和开发基于深度强化学习的集成感知、计划和控制算法。

Nov, 2019

基于 AutoDRIVE 生态系统的合作与竞争自主车辆多智能体深度强化学习

该论文介绍了一种用于自主车辆内部具有合作和竞争行为的模块化且可并行化的多智能体深度强化学习框架。通过使用 AutoDRIVE 生态系统来培养和部署多智能体强化学习策略，并利用具有独特特性和能力的两个缩小比例的自主车辆平台 Nigel 和 F1TENTH 来开发具有物理准确性和图形逼真性的数字孪生模型。

Sep, 2023

城市自主驾驶的无模型深度强化学习

本文提出了一个在复杂城市自主驾驶场景下使用无模型深度强化学习的框架，并在高清晰度驾驶模拟器中进行了验证。结果表明，与基线相比，我们的方法可以很好地解决任务，且表现显著优异。

Apr, 2019

深度强化学习下自动驾驶巡逻：学会交流与合作

无人驾驶车辆在巡逻大面积区域时往往需要协同作用。本文提出了一种基于强化的多智能体协作学习方法，通过训练智能体发展出自己的通信协议，在巡逻过程中进行协作。该解决方案通过模拟实验验证，并从多个方面与其他最先进的巡逻解决方案进行比较。

Jan, 2024