通过基于表示的屏蔽增强部分隐藏城市交通环境下自主代理的安全性

Jul, 2024

通过基于表示的屏蔽增强部分隐藏城市交通环境下自主代理的安全性

Enhancing Safety for Autonomous Agents in Partly Concealed Urban Traffic Environments Through Representation-Based Shielding

HTML

PDF

Pierre Haritz, David Wanke, Thomas Liebig

TL;DR提出了一种以自主交通工具感知信息为中心的新型状态表示方法，通过强化学习实现安全导航，超过其他基准模型在安全和能耗度量方面的性能表现，同时保持了竞争力的平均行驶速度，为更健壮和可靠的自主导航策略铺平道路，从而实现更安全和高效的城市交通环境。

Abstract

Navigating unsignalized intersections in urban environments poses a complex challenge for self-driving vehicles, where issues such as view obstructions, unpredictable pedestrian crossings, and diverse traffic participants demand a great focus on crash prevention. In this paper, we prop

发现论文，激发创造

自主驾驶的安全多智能体强化学习

本文介绍了一种利用深度强化学习解决自动驾驶问题的方案，不同于其他机器人任务，自动驾驶需要确保功能安全和在多个智能体情境下执行正确的决策，其中的主要挑战包括如何处理多个智能体的不确定行为，以及如何在“Desires”策略和难以控制的路径规划之间实现平衡。

Oct, 2016

使用深度强化学习，自主驾驶车辆在遮挡路口中的导航

本文探索利用深度强化学习解决路口问题，发现采用深度RL学习的决策比基础启发式方法更高效，并能有效应对实时不能避让的情况，并探讨其在感知行为方面的应用及未来研究方向。

May, 2017

一日学车

本研究首次将深度强化学习应用于自动驾驶，通过模型自主探索学习一个仅需单目图像为输入的车道跟踪策略，并采用单一、易于获取的奖励措施：在无安全司机控制下行驶的距离。我们使用连续的、无模型的深度强化学习算法，并在车上执行所有探索和优化过程，为自动驾驶开发了一个新的框架，摆脱了对定义逻辑规则、制图和直接监督的依赖，同时也探讨该方法面对更广泛自动驾驶任务时的挑战和机会。

Jul, 2018

城市自主驾驶的无模型深度强化学习

本文提出了一个在复杂城市自主驾驶场景下使用无模型深度强化学习的框架，并在高清晰度驾驶模拟器中进行了验证。结果表明，与基线相比，我们的方法可以很好地解决任务，且表现显著优异。

Apr, 2019

基于场景分解的安全强化学习在复杂城市环境下的导航

我们提出了一种基于模块化的决策算法，以自主导航十字路口的挑战，通过安全机制，置信度更新技术和场景分解方法，提高了行车安全性和决策鲁棒性，并在复杂的十字路口情境中表现了优越性。

Apr, 2019

深度强化学习在道路交通路口驾驶中的自我意识安全性

本研究通过引入注意力机制的自我感知模块，根据碰撞率、成功率、停滞率和总奖励等四个指标，对交叉口和环岛等复杂路口环境下的自主驾驶深度强化学习模型进行安全性能评估，并发现引入自我感知模块的DQN可显著提高安全表现。

Jan, 2022

密集交通路口导航的多任务安全强化学习

本文提出一种基于多任务安全强化学习和社交关注的方法来解决无人驾驶在复杂交通情境下的交通管制问题，模型考虑多种交通极端情况并使用安全监控层来保障安全性。实验结果表明该方法能够有效提高交通安全性和流畅性。

Feb, 2022

基于共享信息的连接自主车辆安全高效行为规划

本研究介绍了一种信息共享和安全多智能体强化学习框架，通过车辆间通信收集处理后的LIDAR和摄像头数据，在提高交通效率和安全方面取得优势，并在CARLA模拟器中得到验证。

Feb, 2023

城市环境中安全互动自主驾驶的想象增强分层强化学习方法

通过引入想象增强的分层强化学习算法，我们设计了一种新的导航算法，使得智能体能够在真实世界的导航任务中学习安全和交互的行为，提高了成功率并减少了平均步骤的数量。

Nov, 2023

安全感知的因果表示法：自主驾驶中可信赖强化学习

自动驾驶中，借助结构化场景信息的安全感知结构化场景表示（FUSION）方法的引入为学习自适应的端到端驾驶策略提供了创新方法。通过构建基于因果关系的奖励、成本、状态和行动空间分解的框架，FUSION 在动态交通环境下进行结构化顺序推理，实现了安全成本和效用回报之间的良好平衡，提高了自动驾驶代理在多样的驾驶场景中的安全性和普适性。

Oct, 2023