自主导航中深度强化学习的安全约束评估
本论文介绍了深度强化学习在自主导航中的应用,指出安全性和泛化性等方面的限制,并探讨了四种学习技术及其在新型开源导航基准和实际环境中的应用,以此进行了全面研究。
Oct, 2022
提出一种基于长短期约束的安全强化学习算法,用于优化端到端自动驾驶的训练过程,实现连续状态和行动任务中更高的安全性和长距离决策任务中更高的探索性能。
Mar, 2024
为了将 RL 算法部署到实际场景中并在学习过程中确保安全性,我们提出了使用转移学习方法学习在一个任务环境中如何保持安全性,然后将所学用于约束在学习新任务时的行为,此方法在三个具有挑战性的领域中实证,相比于标准的深度 RL 技术和以前的安全 RL 方法,我们的方法不但减少了安全事故,还提高了学习的速度和稳定性。
Oct, 2020
本文提出了一种安全的深度强化学习自动驾驶系统,采用了基于规则和基于学习的方法,其中包括手工制作的安全模块和动态学习的安全模块,通过模拟环境的实验结果证明了其优异的性能。
Oct, 2019
将基于学习的技术,特别是强化学习,整合到机器人技术中来解决非结构化环境中的复杂问题很具有前景。本文展示了我们如何以原则性的方式将复杂的安全约束强加于基于学习的机器人系统中,从理论和实践的角度进行了展示。
Apr, 2024
为了确保机器人等自主车辆的广泛部署,本文提出了一种新的闭环范式用于综合安全控制策略,明确考虑系统在可能的未来情景下的演变不确定性,通过物理动力学和机器人的学习算法共同推理,利用对抗深度强化学习进行放大,展示了该框架能够处理贝叶斯信念传播和大规模预训练神经轨迹预测模型引起的隐式学习。
Sep, 2023
本文介绍了一种利用深度强化学习解决自动驾驶问题的方案,不同于其他机器人任务,自动驾驶需要确保功能安全和在多个智能体情境下执行正确的决策,其中的主要挑战包括如何处理多个智能体的不确定行为,以及如何在 “Desires” 策略和难以控制的路径规划之间实现平衡。
Oct, 2016
本文提出了一种基于图卷积网络的互动感知约束优化方法,通过同时训练运动预测和控制模块并共享一个包含社交上下文的潜在表示来鼓励安全驾驶和预测运动。实验结果表明,这种方法在 CARLA 城市驾驶模拟器上具有比基线更好的导航策略和运动预测性能。
Jun, 2022
本文探索利用深度强化学习解决路口问题,发现采用深度 RL 学习的决策比基础启发式方法更高效,并能有效应对实时不能避让的情况,并探讨其在感知行为方面的应用及未来研究方向。
May, 2017