Jun, 2022

LaRa: 多摄像头鸟瞰语义分割的潜在特征与光线

TL;DR本文提出了一种基于编码解码器的自主行驶多摄像头车辆语义分割模型 LaRa,使用跨注意力机制将多个传感器的信息聚合成一组紧凑、丰富的潜在表示,进而在 BEV 空间中再次重投影,证明该模型在 nuScenes 上优于之前使用 Transformer 的最佳表现。