多残差任务学习推广合作生态驾驶
本文提出了一种简化的车辆微观模拟方法,并使用深度强化学习优化了具有不同车辆组成的六个交通系统的控制策略,发现了类似于波浪消减、交通信号和匝道计量等的多种新行为,并分析了这些行为以获得可解释的控制策略。
Jul, 2022
车辆信号控制对缓解现代城市交通拥堵有着重大影响。近年来,深度强化学习被广泛应用于该任务,表现出有希望的性能,但也面临许多挑战,如有限的性能和样本效率。为了应对这些挑战,我们提出了 MTLight,通过学习大量交通指标来增强智能体的观察,并构建多个辅助任务和监督任务来学习潜在状态,并使用任务特定特征和任务共享特征来使潜在状态更丰富。在 CityFlow 上进行了大量实验证明 MTLight 具有领先的收敛速度和渐近性能。我们在所有场景中模拟了高峰小时模式,并且结果表明 MTLight 具有高度的适应性。
Apr, 2024
本篇研究提出了一个基于真实驾驶环境的 MDP 框架,使用多智能体学习算法来实现对自动驾驶车辆的训练,并提出了可靠的初始化、数据增强和训练技术来实现最小化的视频数据和培训,最终在 TORCS 虚拟驾驶环境中得到了验证。
Nov, 2022
我们提出了一种方法,通过随机化基于规则的微观交通流的车辆跟随模型和变道模型的某些参数来随机化周围车辆的驾驶风格和行为,发现在高保真度微观交通流下训练的策略相比其他微观交通流下训练的模型具有更高的成功率和更好的计算奖励。
Mar, 2024
通过随机化基于交互的社交车辆的奖励函数,本研究引入了一种高效的方法来训练多样化的社交车辆驾驶策略作为单一的元策略,并提出了一种训练策略来增强自车驾驶策略的鲁棒性。该方法成功地学习到了在具有挑战性的未控制 T 字形交叉口情景中,对具有分布之外行为的社交车辆场景具有很好泛化性的自车驾驶策略。
Jul, 2023
提出了一种基于深度强化学习的信号控制系统,该系统可以根据交通状况动态调整信号并使用重新路由技术平衡道路网络上的车辆,以帮助优化交通流的管理和减少拥堵。
Jun, 2022
本文研究使用深度强化学习模拟交通动态,模块化学习框架可以提高交通效率并可适应实际网络的复杂情况,单一通道的小型神经网络控制法可以在不同车流情况下消除交通阻塞。
Oct, 2017
本研究基于批量强化学习的方法,运用基于惩罚项的自适应奖励方式在普通的循环交通信号控制策略下,构建出一个马尔可夫决策过程(MDP)的学习框架,不仅提高了对于不同分布情境的管理优化,还显著提高了交通信号控制的效率。
Jan, 2022
提出一种基于强化学习和动作基元的分层框架,可自主收集和重复使用知识来解决城市环境下自动驾驶面临的挑战和不确定性,通过 CARLA 模拟器的测试,其表现优于其他基线方法。
Jul, 2022