利用任务分离和爬山算法进行深度强化学习的自动驾驶车辆
本文提出了不同的深度强化学习方法用于自动驾驶,分别包括离散行动类别中的深度 Q 网络算法 (DQN) 和连续行动类别中的深度确定性演员-评论家算法 (DDAC),并在 TORCS 模拟器中测试了其性能。
Dec, 2016
研究利用深度强化学习提出了一个用于自动驾驶的框架,其中包含了包含循环神经网络的信息集成和关注模型用于减少嵌入式硬件的计算复杂度,并在TORCS仿真器中验证了其自主操纵能力
Apr, 2017
本文提出了一个在复杂城市自主驾驶场景下使用无模型深度强化学习的框架,并在高清晰度驾驶模拟器中进行了验证。结果表明,与基线相比,我们的方法可以很好地解决任务,且表现显著优异。
Apr, 2019
本文阐述了全连接神经网络,卷积神经网络和递归神经网络在处理变量大小输入的强化学习问题方面的局限性,提出了一种利用Deep Sets结构的离线决策方法,用于高层次决策,通过比较各种不同的可能性,表明Deep Sets不仅在总体表现上表现优异,而且在未见情况下呈现更好的泛化性。
Jul, 2019
本文研究了在自动驾驶车辆领域中,传感器技术、通信、安全、人工智能、机器学习、路线规划等多方面的应用,重点阐述了一种基于深度强化学习的层次运动规划方法,并以车跟、车道保持、轨迹跟踪、融合和交通压力等不同场景的自动驾驶为例,总结了现有解决方案的优缺点并提出未来研究方向和挑战。
Jan, 2020
使用深层强化学习训练神经网络来实现自动驾驶规划栈中的控制系统,不仅使模拟环境中的自动驾驶汽车能够在没有障碍物的情况下平稳、安全地行驶,在真实世界城市中也能表现出良好的泛化能力。
Jul, 2022
本文提出了一种简化的车辆微观模拟方法,并使用深度强化学习优化了具有不同车辆组成的六个交通系统的控制策略,发现了类似于波浪消减、交通信号和匝道计量等的多种新行为,并分析了这些行为以获得可解释的控制策略。
Jul, 2022
本研究通过实现、评估和比较两种深度强化学习算法(Deep Q-networks和Trust Region Policy Optimization)来训练自动驾驶车辆,以及开发和应用奖励函数,并在基于模拟环境的高速公路自动驾驶训练平台中进行评估,结果显示TRPO算法在大多数情况下以及将多种驾驶演练和多种路况情况集成于一体的ComplexRoads训练环境中效果最佳。
Jun, 2023
使用深度强化学习(DRL)和逆强化学习(IRL)将局部观察到的锥体位置映射到期望的转向角度以进行赛道跟踪。两种先进算法,软演员批评(SAC)和对抗逆强化学习(AIRL),在代表性模拟中训练模型。在仿真和现实世界中进行的测试表明,这两种算法都可以成功训练用于局部路径跟踪的模型。提出了未来工作的建议,以使这些模型能够适用于完整的Formula:SAE车辆。
Jan, 2024