多智能体连接自主驾驶的深度强化学习

Nov, 2019

多智能体连接自主驾驶的深度强化学习

Multi-Agent Connected Autonomous Driving using Deep Reinforcement Learning

Praveen Palanisamy

TL;DR该论文提出了使用部分可观测马尔可夫博弈来构建具有现实情况的无人驾驶问题，并提供了 MACAD-Gym 平台来进一步研究和开发基于深度强化学习的集成感知、计划和控制算法。

Abstract

The capability to learn and adapt to changes in the driving environment is crucial for developing autonomous driving systems that are scalable beyond geo-fenced operational design domains. deep reinforcement learning

autonomous driving deep reinforcement learning partially observable markov games multi-agent learning environments macad-gym

发现论文，激发创造

自主驾驶的安全多智能体强化学习

本文介绍了一种利用深度强化学习解决自动驾驶问题的方案，不同于其他机器人任务，自动驾驶需要确保功能安全和在多个智能体情境下执行正确的决策，其中的主要挑战包括如何处理多个智能体的不确定行为，以及如何在 “Desires” 策略和难以控制的路径规划之间实现平衡。

Oct, 2016

用于部分可观察环境和有限通信的 R-MADDPG

本文介绍了一种使用深度循环多智能体演员 - 评论家框架（R-MADDPG）处理部分可观测设置和有限通信下多智能体协调的方法，并探究了循环效应对团队智能体表现和通信使用的影响。研究结果表明，该框架可以学习随时间变化的依赖关系，处理资源限制，并在智能体之间开发不同的通信模式。

Feb, 2020

基于深度强化学习的实际驾驶环境离散控制

本篇研究提出了一个基于真实驾驶环境的 MDP 框架，使用多智能体学习算法来实现对自动驾驶车辆的训练，并提出了可靠的初始化、数据增强和训练技术来实现最小化的视频数据和培训，最终在 TORCS 虚拟驾驶环境中得到了验证。

Nov, 2022

自主驾驶的深度强化学习框架

研究利用深度强化学习提出了一个用于自动驾驶的框架，其中包含了包含循环神经网络的信息集成和关注模型用于减少嵌入式硬件的计算复杂度，并在 TORCS 仿真器中验证了其自主操纵能力

Apr, 2017

基于 AutoDRIVE 生态系统的合作与竞争自主车辆多智能体深度强化学习

该论文介绍了一种用于自主车辆内部具有合作和竞争行为的模块化且可并行化的多智能体深度强化学习框架。通过使用 AutoDRIVE 生态系统来培养和部署多智能体强化学习策略，并利用具有独特特性和能力的两个缩小比例的自主车辆平台 Nigel 和 F1TENTH 来开发具有物理准确性和图形逼真性的数字孪生模型。

Sep, 2023

自主驾驶的深度强化学习

本研究旨在利用深度确定性策略梯度算法来应对自主驾驶中复杂的状态和行动空间，我们选择 The Open Racing Car Simulator (TORCS) 来模拟实验环境，并选择适宜的传感器信息设计奖励机制并建立 DPPG 模型，实验结果表明模型在多种场景下均取得了良好的效果。

Nov, 2018

基于深度强化学习的 CARLA 模拟自动驾驶

本论文基于强化学习（RL）与 Deep Q-Learning 框架以及 CARLA 仿真环境，探索了一种实现自动驾驶车辆在高速行驶时保持车道并避让其他车辆的策略，以提高交通安全性。

Jun, 2023

自主驾驶的深度强化学习：一份综述

本文综述了深度强化学习算法在自动驾驶任务上的应用，包括分类、验证、测试和强化现有强化学习算法解决方案的方法，还介绍了相关领域和挑战。

Feb, 2020

端到端深度强化学习实现车道保持辅助

本文提出了不同的深度强化学习方法用于自动驾驶，分别包括离散行动类别中的深度 Q 网络算法 (DQN) 和连续行动类别中的深度确定性演员 - 评论家算法 (DDAC)，并在 TORCS 模拟器中测试了其性能。

Dec, 2016

具备强化学习和演示的安全且通用的端到端自动驾驶系统

智能驾驶系统应能根据当前环境和车辆状况动态制定适当的驾驶策略，确保系统的安全可靠性。本文介绍了一种适用于复杂和各种场景的安全通用端到端自动驾驶系统（SGADS），该系统结合了变分推断与归一化流，使智能车辆能够准确预测未来的驾驶轨迹，并提出了鲁棒安全约束的制定方法。此外，我们将强化学习与示范结合，以增强智能体的搜索过程。实验结果表明，与现有方法相比，我们的 SGADS 能够显著提高安全性能，在复杂城市场景中展现出强大的泛化能力，并提高智能车辆的训练效率。

Jan, 2024