深度强化学习自动驾驶决策的揭秘

Mar, 2024

深度强化学习自动驾驶决策的揭秘

Demystifying Deep Reinforcement Learning-Based Autonomous Vehicle Decision-Making

Hanxi Wan, Pei Li, Arpan Kusari

TL;DR自适应驾驶决策中，深度强化学习模型的黑盒特性限制了实际应用，因此本研究工作关注一种基于注意力机制的可解释深度强化学习框架，并使用连续近端策略优化算法作为基准模型，在开源自适应驾驶仿真环境中加入了多头注意力机制。通过分析技术讨论模型的可解释性和因果关系，发现模型的第一个头部编码了邻近车辆的位置，而第二个头部则专注于领导车辆。此外，自车的动作在时空上受到目标车道上车辆的因果依赖。这些发现可帮助从业人员解读深度强化学习算法的结果。

Abstract

With the advent of universal function approximators in the domain of reinforcement learning, the number of practical applications leveraging deep reinforcement learning (DRL) has exploded. Decision-making in automated d

universal function approximators deep reinforcement learning automated driving interpretability attention-based drl framework

发现论文，激发创造

通过学习端到端的视觉关注来解释自动驾驶

通过使用注意力模型来提高 CARLA 驾驶模拟器的性能，同时通过模仿学习训练代理人来解释自动驾驶中深度学习无法解释的决策问题。

Jun, 2020

使用深度强化学习的自主驾驶顺序决策的分层体系结构

本研究开发了一个多模态架构，包括自我周围环境的建模，并训练了一个深度强化学习代理，以在随机高速公路驾驶场景中实现一致的性能，将自主驾驶问题分成多层控制结构使我们能够将 AI 的能力分别用于解决每一层，最终实现更可靠的系统，可在实际的自动驾驶汽车中实现。

Jun, 2019

强化学习在车载系统中的统一自动控制

本文提出了一种简化的车辆微观模拟方法，并使用深度强化学习优化了具有不同车辆组成的六个交通系统的控制策略，发现了类似于波浪消减、交通信号和匝道计量等的多种新行为，并分析了这些行为以获得可解释的控制策略。

Jul, 2022

自主车辆运动规划深度强化学习调查

本文研究了在自动驾驶车辆领域中，传感器技术、通信、安全、人工智能、机器学习、路线规划等多方面的应用，重点阐述了一种基于深度强化学习的层次运动规划方法，并以车跟、车道保持、轨迹跟踪、融合和交通压力等不同场景的自动驾驶为例，总结了现有解决方案的优缺点并提出未来研究方向和挑战。

Jan, 2020

交通优化中的隐式感知：先进的深度强化学习技术

通过采用深度强化学习从事自主驾驶车辆上的车辆跟随和变道模型，本论文探讨了解决构成道路阻塞的突发情况，提出了基于 Markov 决策过程和 MEC 辅助架构的综合决策控制系统，并通过 SUMO 模拟器和 OPENAI GYM 评估了该模型的性能，结果显示使用 ε-greedy 策略进行训练的 DQN 代理明显优于使用 Boltzmann 策略进行训练的代理。

Sep, 2023

城市自主驾驶的无模型深度强化学习

本文提出了一个在复杂城市自主驾驶场景下使用无模型深度强化学习的框架，并在高清晰度驾驶模拟器中进行了验证。结果表明，与基线相比，我们的方法可以很好地解决任务，且表现显著优异。

Apr, 2019

具有潜在深度强化学习的可解释端到端城市自主驾驶

该研究提出了一种解决复杂城市场景下的自动驾驶问题的可解释性深度强化学习方法，在学习过程中引入了序贯潜在环境模型，并生成了语义鸟瞰遮罩，以解释学习策略的行为。实验结果显示，该方法在城市场景中的表现优于 DQN、DDPG、TD3 和 SAC 等基线模型。

Jan, 2020

自主高速公路驾驶的预测决策

本文提出了一种基于预测的深度强化学习决策模型，考虑了周围车辆的操作意图，并使用真实交通数据进行训练。经过模拟测试，结果表明和基于深度强化学习的模型相比，该模型在复杂的高速公路驾驶场景中提高了决策性能，从而减少了碰撞数量，实现了更安全的驾驶。

Sep, 2022

自主驾驶的深度强化学习框架

研究利用深度强化学习提出了一个用于自动驾驶的框架，其中包含了包含循环神经网络的信息集成和关注模型用于减少嵌入式硬件的计算复杂度，并在 TORCS 仿真器中验证了其自主操纵能力

Apr, 2017

基于策略深度强化学习和智能路由的自主车辆交通管理

提出了一种基于深度强化学习的信号控制系统，该系统可以根据交通状况动态调整信号并使用重新路由技术平衡道路网络上的车辆，以帮助优化交通流的管理和减少拥堵。

Jun, 2022