多残差任务学习推广合作生态驾驶

Mar, 2024

多残差任务学习推广合作生态驾驶

Generalizing Cooperative Eco-driving via Multi-residual Task Learning

Vindula Jayawardana, Sirui Li, Cathy Wu, Yashar Farid, Kentaro Oguchi

TL;DR基于多任务学习的多残差任务学习（MRTL）框架在自动驾驶领域中的深度强化学习（DRL）和常规控制方法的结合具有潜力，能够在多样化的交通场景中实现可迁移的控制。

Abstract

Conventional control, such as model-based control, is commonly utilized in autonomous driving due to its efficiency and reliability. However, real-world autonomous driving contends with a multitude of diverse

autonomous driving deep reinforcement learning multi-residual task learning traffic scenarios system control

发现论文，激发创造

强化学习在车载系统中的统一自动控制

本文提出了一种简化的车辆微观模拟方法，并使用深度强化学习优化了具有不同车辆组成的六个交通系统的控制策略，发现了类似于波浪消减、交通信号和匝道计量等的多种新行为，并分析了这些行为以获得可解释的控制策略。

Jul, 2022

MTLight：高效多任务强化学习用于交通信号控制

车辆信号控制对缓解现代城市交通拥堵有着重大影响。近年来，深度强化学习被广泛应用于该任务，表现出有希望的性能，但也面临许多挑战，如有限的性能和样本效率。为了应对这些挑战，我们提出了 MTLight，通过学习大量交通指标来增强智能体的观察，并构建多个辅助任务和监督任务来学习潜在状态，并使用任务特定特征和任务共享特征来使潜在状态更丰富。在 CityFlow 上进行了大量实验证明 MTLight 具有领先的收敛速度和渐近性能。我们在所有场景中模拟了高峰小时模式，并且结果表明 MTLight 具有高度的适应性。

Apr, 2024

基于深度强化学习的实际驾驶环境离散控制

本篇研究提出了一个基于真实驾驶环境的 MDP 框架，使用多智能体学习算法来实现对自动驾驶车辆的训练，并提出了可靠的初始化、数据增强和训练技术来实现最小化的视频数据和培训，最终在 TORCS 虚拟驾驶环境中得到了验证。

Nov, 2022

使用无模型强化学习在密集交通中驾驶

本研究使用深度强化学习来生成一种连续控制规划方案，让自动驾驶汽车在拥挤的道路上实现车道变换，并与基于模型预测控制算法进行对比测试。

Sep, 2019

通过强化学习进行交通流随机化的自主车辆决策与控制

我们提出了一种方法，通过随机化基于规则的微观交通流的车辆跟随模型和变道模型的某些参数来随机化周围车辆的驾驶风格和行为，发现在高保真度微观交通流下训练的策略相比其他微观交通流下训练的模型具有更高的成功率和更好的计算奖励。

Mar, 2024

引导元强化学习下的鲁棒驾驶策略学习

通过随机化基于交互的社交车辆的奖励函数，本研究引入了一种高效的方法来训练多样化的社交车辆驾驶策略作为单一的元策略，并提出了一种训练策略来增强自车驾驶策略的鲁棒性。该方法成功地学习到了在具有挑战性的未控制 T 字形交叉口情景中，对具有分布之外行为的社交车辆场景具有很好泛化性的自车驾驶策略。

Jul, 2023

基于策略深度强化学习和智能路由的自主车辆交通管理

提出了一种基于深度强化学习的信号控制系统，该系统可以根据交通状况动态调整信号并使用重新路由技术平衡道路网络上的车辆，以帮助优化交通流的管理和减少拥堵。

Jun, 2022

混合自主车辆交通的模块化学习框架：Flow

本文研究使用深度强化学习模拟交通动态，模块化学习框架可以提高交通效率并可适应实际网络的复杂情况，单一通道的小型神经网络控制法可以在不同车流情况下消除交通阻塞。

Oct, 2017

用于路面交通管制的离线强化学习技术

本研究基于批量强化学习的方法，运用基于惩罚项的自适应奖励方式在普通的循环交通信号控制策略下，构建出一个马尔可夫决策过程（MDP）的学习框架，不仅提高了对于不同分布情境的管理优化，还显著提高了交通信号控制的效率。

Jan, 2022

基于技能发现的自动驾驶车辆交叉口自适应决策

提出一种基于强化学习和动作基元的分层框架，可自主收集和重复使用知识来解决城市环境下自动驾驶面临的挑战和不确定性，通过 CARLA 模拟器的测试，其表现优于其他基线方法。

Jul, 2022