基于状态放弃的课程增量强化学习在无信号路口自动驾驶中的应用
本文介绍了一种利用深度强化学习解决自动驾驶问题的方案,不同于其他机器人任务,自动驾驶需要确保功能安全和在多个智能体情境下执行正确的决策,其中的主要挑战包括如何处理多个智能体的不确定行为,以及如何在“Desires”策略和难以控制的路径规划之间实现平衡。
Oct, 2016
研究利用深度强化学习提出了一个用于自动驾驶的框架,其中包含了包含循环神经网络的信息集成和关注模型用于减少嵌入式硬件的计算复杂度,并在TORCS仿真器中验证了其自主操纵能力
Apr, 2017
本文探索利用深度强化学习解决路口问题,发现采用深度RL学习的决策比基础启发式方法更高效,并能有效应对实时不能避让的情况,并探讨其在感知行为方面的应用及未来研究方向。
May, 2017
本文探讨了自主车辆交叉路口处理的强化学习问题,并研究了其在转移学习情况下的行为。研究发现,对于不同的路口,同一种训练网络通常无法推广。然而,一个在一个十字路口上训练过,并在另一个路口上微调过的网络,相较于孤立训练,能更好地进行新任务。此外,本文还论证了对于将模拟交叉口处理知识从计算机模拟环境传递到实际自主车辆时,微调的好处。
Nov, 2017
本研究首次将深度强化学习应用于自动驾驶,通过模型自主探索学习一个仅需单目图像为输入的车道跟踪策略,并采用单一、易于获取的奖励措施:在无安全司机控制下行驶的距离。我们使用连续的、无模型的深度强化学习算法,并在车上执行所有探索和优化过程,为自动驾驶开发了一个新的框架,摆脱了对定义逻辑规则、制图和直接监督的依赖,同时也探讨该方法面对更广泛自动驾驶任务时的挑战和机会。
Jul, 2018
本文提出了一个在复杂城市自主驾驶场景下使用无模型深度强化学习的框架,并在高清晰度驾驶模拟器中进行了验证。结果表明,与基线相比,我们的方法可以很好地解决任务,且表现显著优异。
Apr, 2019
该论文提出了一个基于深度强化学习的交通协同优化框架,用于增强无信号道路交叉口的驾驶安全性和路段通行能力,其最重要的优点是将计算时间复杂度降低到毫秒级并能够应对不同车道数量的高扩展性。
May, 2022
提出一种基于强化学习和动作基元的分层框架,可自主收集和重复使用知识来解决城市环境下自动驾驶面临的挑战和不确定性,通过CARLA模拟器的测试,其表现优于其他基线方法。
Jul, 2022
研究该论文中,通过使用基于Twin Delayed Deep Deterministic Policy Gradient (TD3) 强化学习算法的低成本单一智能体方法,提出了有效解决自动驾驶车辆在复杂T字路口中的导航问题,并证明了该方法在CARLA模拟平台中表现出稳定、安全且具有改进性能的结果,通过减少旅行延误、碰撞最小化和降低整体成本等方面的优势,在自动驾驶应用中为强化学习提供了有价值的知识,并突出体现了采用单一智能体、低成本方法在解决复杂驾驶场景和进一步推进强化学习算法方面的潜力。
Sep, 2023