May, 2022

BEVerse: 基于鸟瞰视角的统一感知和预测,用于以视觉为中心的自动驾驶

TL;DR该研究提出了基于多相机系统的统一三维感知和预测框架 BEVerse,通过对多相机视频生成空间 - 时间鸟瞰(BEV)表示,并同时推理多个自动驾驶视觉任务,通过在 nuScenes 数据集上的实验表明,与现有的单任务方法相比,多任务 BEVerse 在 3D 物体检测,语义地图构建和运动预测方面表现更好,同时比时序范例更加高效。