规模化即是所需：利用 JAX 加速强化学习训练自动驾驶强化策略

Dec, 2023

规模化即是所需：利用 JAX 加速强化学习训练自动驾驶强化策略

Scaling Is All You Need: Training Strong Policies for Autonomous Driving with JAX-Accelerated Reinforcement Learning

Moritz Harmel, Anubhav Paras, Andreas Pasternak, Gary Linscott

TL;DR通过大规模强化学习应用于自动驾驶，分析了在实验规模逐渐扩大时由此产生的策略表现以及对策略表现的主要影响因素。

Abstract

reinforcement learning has been used to train policies that outperform even the best human players in various games. However, a large amount of data is needed to achieve good performance, which in turn requires b

reinforcement learning autonomous driving policies large-scale simulator

发现论文，激发创造

基于深度强化学习的 CARLA 模拟自动驾驶

本论文基于强化学习（RL）与 Deep Q-Learning 框架以及 CARLA 仿真环境，探索了一种实现自动驾驶车辆在高速行驶时保持车道并避让其他车辆的策略，以提高交通安全性。

Jun, 2023

自主驾驶的深度强化学习：一份综述

本文综述了深度强化学习算法在自动驾驶任务上的应用，包括分类、验证、测试和强化现有强化学习算法解决方案的方法，还介绍了相关领域和挑战。

Feb, 2020

基于仿真的强化学习在自主驾驶中的应用

采用强化学习和模拟技术开发驾驶系统，使用合成数据进行训练并验证了其在真实道路环境中的稳健性与有效性。

Nov, 2019

自主驾驶的安全多智能体强化学习

本文介绍了一种利用深度强化学习解决自动驾驶问题的方案，不同于其他机器人任务，自动驾驶需要确保功能安全和在多个智能体情境下执行正确的决策，其中的主要挑战包括如何处理多个智能体的不确定行为，以及如何在 “Desires” 策略和难以控制的路径规划之间实现平衡。

Oct, 2016

使用深度强化学习在 Gran Turismo Sport 中实现超人类表现

本文提出了一种基于深度强化学习、高保真的物理模拟和课程进展奖励的学习系统，用于 Gran Turismo Sport 自动汽车竞赛，并在超过 50,000 名人类玩家数据集中，实现了超越自带 AI 和人类最快驾驶者的自主赛车性能。

Aug, 2020

自主驾驶的深度强化学习框架

研究利用深度强化学习提出了一个用于自动驾驶的框架，其中包含了包含循环神经网络的信息集成和关注模型用于减少嵌入式硬件的计算复杂度，并在 TORCS 仿真器中验证了其自主操纵能力

Apr, 2017

一日学车

本研究首次将深度强化学习应用于自动驾驶，通过模型自主探索学习一个仅需单目图像为输入的车道跟踪策略，并采用单一、易于获取的奖励措施：在无安全司机控制下行驶的距离。我们使用连续的、无模型的深度强化学习算法，并在车上执行所有探索和优化过程，为自动驾驶开发了一个新的框架，摆脱了对定义逻辑规则、制图和直接监督的依赖，同时也探讨该方法面对更广泛自动驾驶任务时的挑战和机会。

Jul, 2018

基于参数化技能和先验知识的自动驾驶高效强化学习

ASAP-RL 提出了一种基于动作技能和专家先验知识的自动驾驶高效强化学习算法，旨在应对在复杂的拥堵道路条件下，传统驾驶策略难以扩展的问题。实验结果表明，相对于其他应用不同技能和先验知识的方法，该算法能够提高学习效率和驾驶性能。

May, 2023

自主车辆上的安全强化学习

本研究探讨了如何通过预测来约束探索，从而实现强化学习在自动驾驶中的安全学习。

Sep, 2019

通过对抗强化学习提高自动驾驶车辆控制的稳健性和安全性

该研究比较了 Robust Adversarial Reinforcement Learning 和 Neural Fictitious Self Play 算法在自动驾驶场景下的性能表现，将学习问题定义为自主系统与环境干扰之间的两人博弈，扩展为半竞争的情况，结果表明对手更好地捕捉了有意义的干扰，从而产生了更好的驾驶效率和减少了与传统强化学习方法相比的碰撞率。

Mar, 2019