具有潜在深度强化学习的可解释端到端城市自主驾驶

Jan, 2020

具有潜在深度强化学习的可解释端到端城市自主驾驶

Interpretable End-to-end Urban Autonomous Driving with Latent Deep Reinforcement Learning

Jianyu Chen, Shengbo Eben Li, Masayoshi Tomizuka

TL;DR该研究提出了一种解决复杂城市场景下的自动驾驶问题的可解释性深度强化学习方法，在学习过程中引入了序贯潜在环境模型，并生成了语义鸟瞰遮罩，以解释学习策略的行为。实验结果显示，该方法在城市场景中的表现优于 DQN、DDPG、TD3 和 SAC 等基线模型。

Abstract

Unlike popular modularized framework, end-to-end autonomous driving seeks to solve the perception, decision and control problems in an integrated way, which can be more adapting to new scenarios and easier to generalize at scale. However, existing end-to-end approaches are often lack o

end-to-end autonomous driving interpretable deep reinforcement learning urban scenarios latent environment model semantic birdeye mask

发现论文，激发创造

城市自主驾驶的无模型深度强化学习

本文提出了一个在复杂城市自主驾驶场景下使用无模型深度强化学习的框架，并在高清晰度驾驶模拟器中进行了验证。结果表明，与基线相比，我们的方法可以很好地解决任务，且表现显著优异。

Apr, 2019

通过模仿强化学习教练实现端到端城市驾驶

通过强化学习教练，我们的端到端自主驾驶智能体实现了与人类专家水平接近的表现，其能够通过鸟瞰图像实现连续的低级别操作，提供可靠的监督信号，从而在 NoCrash-dense 基准测试和 CARLA LeaderBoard 公共路线方面达到了最先进的性能。

Aug, 2021

深度强化学习自动驾驶决策的揭秘

自适应驾驶决策中，深度强化学习模型的黑盒特性限制了实际应用，因此本研究工作关注一种基于注意力机制的可解释深度强化学习框架，并使用连续近端策略优化算法作为基准模型，在开源自适应驾驶仿真环境中加入了多头注意力机制。通过分析技术讨论模型的可解释性和因果关系，发现模型的第一个头部编码了邻近车辆的位置，而第二个头部则专注于领导车辆。此外，自车的动作在时空上受到目标车道上车辆的因果依赖。这些发现可帮助从业人员解读深度强化学习算法的结果。

Mar, 2024

利用潜在状态推断和时空关系实现自主驾驶的强化学习

本文介绍了利用深度强化学习和图神经网络，结合编码潜在状态和空间 - 时间关系的方法解决自动驾驶场景下规避横穿车辆的难点，实现了显著性能提升。

Nov, 2020

通过学习端到端的视觉关注来解释自动驾驶

通过使用注意力模型来提高 CARLA 驾驶模拟器的性能，同时通过模仿学习训练代理人来解释自动驾驶中深度学习无法解释的决策问题。

Jun, 2020

端到端深度强化学习实现车道保持辅助

本文提出了不同的深度强化学习方法用于自动驾驶，分别包括离散行动类别中的深度 Q 网络算法 (DQN) 和连续行动类别中的深度确定性演员 - 评论家算法 (DDAC)，并在 TORCS 模拟器中测试了其性能。

Dec, 2016

自主驾驶的深度强化学习框架

研究利用深度强化学习提出了一个用于自动驾驶的框架，其中包含了包含循环神经网络的信息集成和关注模型用于减少嵌入式硬件的计算复杂度，并在 TORCS 仿真器中验证了其自主操纵能力

Apr, 2017

基于隐含机会的城市驾驶端到端无模型强化学习

本文采用一种叫 implicit affordances 的新技术，成功地通过强化学习算法完成了诸如车道保持，行人和车辆避让，以及红绿灯检测等复杂任务，最终在 CARLA 挑战赛中获胜。

Nov, 2019

基于语义深度云地图和多智能体技术的端到端自动驾驶

本文提出了一种深度学习模型，通过端到端和多任务学习方法进行训练，同时执行感知和控制任务，用于自动驾驶车辆的点对点导航；在 CARLA 模拟器上进行评估，同时与其他已有模型进行比较和消融实验，实现了更高的驾驶分数。

Apr, 2022

使用深度强化学习的自主驾驶顺序决策的分层体系结构

本研究开发了一个多模态架构，包括自我周围环境的建模，并训练了一个深度强化学习代理，以在随机高速公路驾驶场景中实现一致的性能，将自主驾驶问题分成多层控制结构使我们能够将 AI 的能力分别用于解决每一层，最终实现更可靠的系统，可在实际的自动驾驶汽车中实现。

Jun, 2019