模仿专家学习节能驾驶行为
针对自主驾驶中手工制定决策规则的困难,利用易于收集的人类驾驶数据学习行为的能力,同时结合计算机视觉的语义、几何和运动表征,提出了一种基于条件模仿学习的端到端方法,使自动驾驶车辆能够在城区中跟随用户指定的路线,具备横向和纵向控制能力,并且在欧洲城市街道上行驶了 35 公里的新路线。
Nov, 2019
我们提出了一种使用低成本传感器进行敏捷越野自主驾驶的端到端模仿学习系统,通过模仿配备高级传感器的模型预测控制器,我们训练了一个深度神经网络控制策略,将原始的高维观测映射到连续的转向和油门命令,这个方法不需要状态估计或实时规划来导航车辆,并通过在线模仿学习克服了协变量漂移方面的挑战,实现了成功的高速越野行驶,匹配了最新的性能水平。
Sep, 2017
本文提出了一种基于高层指令输入的条件性模仿学习方法,使得经过训练的车辆在测试时间内仍然能够遵循导航指令,本文在仿真实验和机器人卡车实验中对各种条件性模仿学习架构进行了评估和实践。
Oct, 2017
本研究旨在通过模仿学习训练一个自动驾驶策略,以使其足够强大以驾驶真实汽车。为了应对复杂的驾驶场景,我们建议在专家的驾驶基础上引入扰动来合成数据,并使用额外的损失函数强化模型。实验证明这种模型能够在模拟环境中适应复杂的驾驶场景,并能够在真实环境下驾驶汽车。
Dec, 2018
使用知识分享和个性化的方式描述了一种学习自动驾驶车辆(AVs)驾驶模型的框架,该模型在多个车辆之间进行知识分享,以提高其在真实世界中驾驶场景的暴露度。该方法通过共同训练一个驾驶模型,同时保留针对每个车辆独特条件和特性的个性化模型,实现了多个车辆之间的协作而无需共享原始数据。该方法在实验模拟中展示了出色的性能,适用于智能交通系统、交通管理和车辆之间的通信等多个交通工程应用领域。
Aug, 2023
提出了一种基于深度强化学习的信号控制系统,该系统可以根据交通状况动态调整信号并使用重新路由技术平衡道路网络上的车辆,以帮助优化交通流的管理和减少拥堵。
Jun, 2022
通过使用田纳西州 I-24 高速公路的实际轨迹数据,在一条车道的仿真中运行深度强化学习方法来训练减少能耗的波浪平滑策略,我们展示了在低 4% 的自动驾驶车辆渗透率下,对于出现许多停停走走波浪的轨迹,可以实现超过 15% 的显著节省燃料,分析了控制器的平滑效果以及对仿真中添加车道变更和消除下游信息的鲁棒性。
Jan, 2024
本文提出一种基于强化学习的环保行车控制策略,通过对不同交通场景的模拟比较,在全自动驾驶交通方式下可将燃油消耗降低 18%, CO2 排放降低 25%,同时提高 20% 的车速,并且即使只有 25% 的自动驾驶汽车,也能带来至少 50% 的燃油和排放降低效益
Apr, 2022
通过引入一种新型的非对称的演员 - 评论家模型,采用单智能体强化学习来学习分散协作驾驶策略,利用掩码的注意神经网络处理实际交通流的动态特性和部分可观测性,我们的模型在不同交通情景中表现出提高道路系统中各个瓶颈位置交通流的巨大潜力,并且通过探索自动驾驶车辆遵守交通规则的保守驾驶行为所带来的挑战,实验证明我们提出的协作策略可以在不影响安全性的情况下缓解潜在的交通减速。
Mar, 2024