自主导航中深度强化学习的安全约束评估

Jul, 2023

自主导航中深度强化学习的安全约束评估

Evaluation of Safety Constraints in Autonomous Navigation with Deep Reinforcement Learning

Brian Angulo, Gregory Gorbov, Aleksandr Panov, Konstantin Yakovlev

TL;DR此研究比较了两种可学习导航策略（安全和不安全），表明安全策略能够在训练过程中生成具有更大间隙（与障碍物之间的距离）的轨迹，减少碰撞，且不影响整体性能。

Abstract

While reinforcement learning algorithms have had great success in the field of autonomous navigation, they cannot be straightforwardly applied to the real autonomous systems without considering the →

reinforcement learning autonomous navigation safety constraints learnable navigation policies trajectories with more clearance

发现论文，激发创造

自主车辆上的安全强化学习

本研究探讨了如何通过预测来约束探索，从而实现强化学习在自动驾驶中的安全学习。

Sep, 2019

自主导航强化学习技术基准测试

本论文介绍了深度强化学习在自主导航中的应用，指出安全性和泛化性等方面的限制，并探讨了四种学习技术及其在新型开源导航基准和实际环境中的应用，以此进行了全面研究。

Oct, 2022

长短期约束驱动的安全强化学习在自动驾驶中的应用

提出一种基于长短期约束的安全强化学习算法，用于优化端到端自动驾驶的训练过程，实现连续状态和行动任务中更高的安全性和长距离决策任务中更高的探索性能。

Mar, 2024

学习保证安全：带安全评论家的深度强化学习

为了将 RL 算法部署到实际场景中并在学习过程中确保安全性，我们提出了使用转移学习方法学习在一个任务环境中如何保持安全性，然后将所学用于约束在学习新任务时的行为，此方法在三个具有挑战性的领域中实证，相比于标准的深度 RL 技术和以前的安全 RL 方法，我们的方法不但减少了安全事故，还提高了学习的速度和稳定性。

Oct, 2020

自主高速公路驾驶增强安全的深度强化学习

本文提出了一种安全的深度强化学习自动驾驶系统，采用了基于规则和基于学习的方法，其中包括手工制作的安全模块和动态学习的安全模块，通过模拟环境的实验结果证明了其优异的性能。

Oct, 2019

约束流形上的安全强化学习：理论与应用

将基于学习的技术，特别是强化学习，整合到机器人技术中来解决非结构化环境中的复杂问题很具有前景。本文展示了我们如何以原则性的方式将复杂的安全约束强加于基于学习的机器人系统中，从理论和实践的角度进行了展示。

Apr, 2024

学习感知交互式自主安全性

为了确保机器人等自主车辆的广泛部署，本文提出了一种新的闭环范式用于综合安全控制策略，明确考虑系统在可能的未来情景下的演变不确定性，通过物理动力学和机器人的学习算法共同推理，利用对抗深度强化学习进行放大，展示了该框架能够处理贝叶斯信念传播和大规模预训练神经轨迹预测模型引起的隐式学习。

Sep, 2023

自主驾驶的安全多智能体强化学习

本文介绍了一种利用深度强化学习解决自动驾驶问题的方案，不同于其他机器人任务，自动驾驶需要确保功能安全和在多个智能体情境下执行正确的决策，其中的主要挑战包括如何处理多个智能体的不确定行为，以及如何在 “Desires” 策略和难以控制的路径规划之间实现平衡。

Oct, 2016

GIN：自动驾驶中基于图形交互感知约束策略优化

本文提出了一种基于图卷积网络的互动感知约束优化方法，通过同时训练运动预测和控制模块并共享一个包含社交上下文的潜在表示来鼓励安全驾驶和预测运动。实验结果表明，这种方法在 CARLA 城市驾驶模拟器上具有比基线更好的导航策略和运动预测性能。

Jun, 2022

使用深度强化学习，自主驾驶车辆在遮挡路口中的导航

本文探索利用深度强化学习解决路口问题，发现采用深度 RL 学习的决策比基础启发式方法更高效，并能有效应对实时不能避让的情况，并探讨其在感知行为方面的应用及未来研究方向。

May, 2017