利用任务分离和爬山算法进行深度强化学习的自动驾驶车辆

Nov, 2017

利用任务分离和爬山算法进行深度强化学习的自动驾驶车辆

Automating Vehicles by Deep Reinforcement Learning using Task Separation with Hill Climbing

Mogens Graf Plessen

TL;DR本研究文章提出了一种基于模型的强化学习算法，包括任务分离和山峰爬升等策略，用于在自主驾驶中学习深度神经网络参数化控制器，并采用虚拟速度约束与最大稀疏奖励的组合。

Abstract

Within the context of autonomous vehicles, classical model-based control methods suffer from the trade-off between model complexity and computational burden required for the online solution of expensive optimization or search problems at every short sampling time. These methods include sampling-based algorithms, lattice-based algorithms and algorithms based

发现论文，激发创造

端到端深度强化学习实现车道保持辅助

本文提出了不同的深度强化学习方法用于自动驾驶，分别包括离散行动类别中的深度 Q 网络算法 (DQN) 和连续行动类别中的深度确定性演员-评论家算法 (DDAC)，并在 TORCS 模拟器中测试了其性能。

Dec, 2016

自主驾驶的深度强化学习框架

研究利用深度强化学习提出了一个用于自动驾驶的框架，其中包含了包含循环神经网络的信息集成和关注模型用于减少嵌入式硬件的计算复杂度，并在TORCS仿真器中验证了其自主操纵能力

Apr, 2017

城市自主驾驶的无模型深度强化学习

本文提出了一个在复杂城市自主驾驶场景下使用无模型深度强化学习的框架，并在高清晰度驾驶模拟器中进行了验证。结果表明，与基线相比，我们的方法可以很好地解决任务，且表现显著优异。

Apr, 2019

自动驾驶中的深度强化学习动态输入

本文阐述了全连接神经网络，卷积神经网络和递归神经网络在处理变量大小输入的强化学习问题方面的局限性，提出了一种利用Deep Sets结构的离线决策方法，用于高层次决策，通过比较各种不同的可能性，表明Deep Sets不仅在总体表现上表现优异，而且在未见情况下呈现更好的泛化性。

Jul, 2019

自主车辆运动规划深度强化学习调查

本文研究了在自动驾驶车辆领域中，传感器技术、通信、安全、人工智能、机器学习、路线规划等多方面的应用，重点阐述了一种基于深度强化学习的层次运动规划方法，并以车跟、车道保持、轨迹跟踪、融合和交通压力等不同场景的自动驾驶为例，总结了现有解决方案的优缺点并提出未来研究方向和挑战。

Jan, 2020

运用深度强化学习解决实际自动驾驶问题

使用深层强化学习训练神经网络来实现自动驾驶规划栈中的控制系统，不仅使模拟环境中的自动驾驶汽车能够在没有障碍物的情况下平稳、安全地行驶，在真实世界城市中也能表现出良好的泛化能力。

Jul, 2022

强化学习在车载系统中的统一自动控制

本文提出了一种简化的车辆微观模拟方法，并使用深度强化学习优化了具有不同车辆组成的六个交通系统的控制策略，发现了类似于波浪消减、交通信号和匝道计量等的多种新行为，并分析了这些行为以获得可解释的控制策略。

Jul, 2022

针对各种模拟驾驶操作的深度强化学习自动驾驶的全面培训和评估

本研究通过实现、评估和比较两种深度强化学习算法（Deep Q-networks和Trust Region Policy Optimization）来训练自动驾驶车辆，以及开发和应用奖励函数，并在基于模拟环境的高速公路自动驾驶训练平台中进行评估，结果显示TRPO算法在大多数情况下以及将多种驾驶演练和多种路况情况集成于一体的ComplexRoads训练环境中效果最佳。

Jun, 2023

车辆轨迹控制的高效数据深度强化学习

采用数据高效的深度强化学习方法研究车辆轨迹控制，发现新的模型推理方法并将动力学预测和车辆定位分离，比传统方法更高效地学习控制策略。

Nov, 2023

自主Formula SAE车辆的局部路径跟踪的深度强化学习

使用深度强化学习（DRL）和逆强化学习（IRL）将局部观察到的锥体位置映射到期望的转向角度以进行赛道跟踪。两种先进算法，软演员批评（SAC）和对抗逆强化学习（AIRL），在代表性模拟中训练模型。在仿真和现实世界中进行的测试表明，这两种算法都可以成功训练用于局部路径跟踪的模型。提出了未来工作的建议，以使这些模型能够适用于完整的Formula:SAE车辆。

Jan, 2024