从失误中学习：自动驾驶车辆规划中缓解分布偏移的弱监督方法

Jun, 2024

从失误中学习：自动驾驶车辆规划中缓解分布偏移的弱监督方法

Learning from Mistakes: a Weakly-supervised Method for Mitigating the Distribution Shift in Autonomous Vehicle Planning

Fazel Arasteh, Mohammed Elmahgiubi, Behzad Khamidehi, Hamidreza Mirkhani, Weize Zhang...

TL;DR应对协变量转移现象的挑战，我们提出了 Learn from Mistakes (LfM) 作为解决方案。通过在各种场景中部署预训练的规划器，LfM 标记离开其即时目标的情况作为错误，并将这些错误对应的环境分类为闭环错误数据集。为了利用闭环错误进行学习，我们引入了弱监督方法 Validity Learning 来确定当前环境背景中的有效轨迹，实验结果表明该方法显著提高了封闭环路指标，如进展和碰撞率。

Abstract

The planning problem constitutes a fundamental aspect of the autonomous driving framework. Recent strides in representation learning have empowered vehicles to comprehend their surrounding environments, thereby facilitating the integration of learning-based planning strategies. Among t

autonomous driving framework representation learning imitation learning learn from mistakes (lfm)validity learning

发现论文，激发创造

面向分布感知的自主驾驶安全目标预测和符合模型规划

本文提出了一种基于模块化架构的学车任务分解方法，在障碍感知、目标预测和规划方面均取得了优秀的方法，并在 CARLA 模拟器上实现了最新的优秀结果。

Dec, 2022

自主车辆能否识别并适应分布变化？

本文提出了一种新的方法，名称为稳健仿真规划（RIP），可以检测和适应一些分布的偏移，减少 OOD 场景中的自信和灾难性外推。如果模型的不确定性太高，建议采用反馈机制，同时引入一个自动驾驶汽车新场景基准测试（CARNOVEL）来评估驾驶代理的鲁棒性。

Jun, 2020

学习型车辆运动规划的误解分析

nuPlan 提供了第一个大规模实际数据集和评估计划，对于需要精确的短期规划和长期本体预测，现有系统难以同时满足这两个要求，我们提出了一种基于规则的简单而高效的策划方法，从而在 nuPlan 计划挑战中赢得了胜利。

Jun, 2023

通过零样本课程将合成的离线策略经验嵌入到自动驾驶中

本研究提出了一种新的驾驶场景难度预测方法，通过仅使用部分数据对自动驾驶代理进行训练，可以在保证性能的同时，显著降低碰撞率和提高路线准确性。

Dec, 2022

自主驾驶规划中基于层次模型的模仿学习

使用 MGAIL 在密集城市自动驾驶方面进行了第一次大规模应用，通过使用分层模型和经过现实汽车采集的经验轨迹进行性能度量，并结合闭环 MGAIL 损失和开环行为克隆损失实现了稳健的导航策略。

Oct, 2022

ChauffeurNet：学习最好的驾驶方式，合成最差的驾驶方式

本研究旨在通过模仿学习训练一个自动驾驶策略，以使其足够强大以驾驶真实汽车。为了应对复杂的驾驶场景，我们建议在专家的驾驶基础上引入扰动来合成数据，并使用额外的损失函数强化模型。实验证明这种模型能够在模拟环境中适应复杂的驾驶场景，并能够在真实环境下驾驶汽车。

Dec, 2018

基于条件仿真学习的城市驾驶控制

针对自主驾驶中手工制定决策规则的困难，利用易于收集的人类驾驶数据学习行为的能力，同时结合计算机视觉的语义、几何和运动表征，提出了一种基于条件模仿学习的端到端方法，使自动驾驶车辆能够在城区中跟随用户指定的路线，具备横向和纵向控制能力，并且在欧洲城市街道上行驶了 35 公里的新路线。

Nov, 2019

LASIL: 面向学习者感知的长期微观交通模拟的有监督模仿学习

本文介绍了一种称为学习者感知的监督式模仿学习模型，用于解决多智能体模仿学习中的协变量转移问题，通过利用变分自动编码器同时建模专家和学习者状态分布，在城市交通仿真中应用，展示了在真实数据集 pNEUMA 上在短期微观和长期宏观仿真中相较于现有 baselines 的显著改进。

Mar, 2024

闭环 LLM 规划器的基于不确定性的故障检测评估

通过引入一个名为 KnowLoop 的基于不确定性的 MLLMs 故障检测器支持的闭环 LLM-based planning 框架，我们试图减轻 LLM-based planning 的开放环路问题，进而提高任务的成功率。

Jun, 2024

自主驾驶中基于模仿的规划器的再思考

基于模仿的驾驶规划者在最近几年取得了相当大的成功。然而，由于缺乏标准化的基准，各种设计的有效性仍然不清楚。新发布的 nuPlan 解决了这个问题，提供了一个大规模的真实世界数据集和一个标准化的闭环基准，以便进行公平比较。利用这个平台，我们对两个基本但尚未充分探索的方面进行了全面研究：自我规划的基本特征和减少复合误差的有效数据增强技术。此外，我们还强调了当前学习系统忽视的模仿差距。最后，结合我们的发现，我们提出了一个强大的基准模型 - PlanTF。我们的结果表明，一个经过精心设计的纯模仿规划者可以在与包含手工规则的最先进方法相比具有高度竞争力的性能，并在长尾案例中展示出卓越的泛化能力。我们的模型和基准可供公开使用。项目网站：https://this URL

Sep, 2023