Feb, 2023

基于视觉的三视角视图的 3D 语义占用预测

TL;DR采用鸟瞰图(BEV)描述自动驾驶中的三维场景难以描绘细粒度的三维结构,因此我们提出了三面图(TPV)表示法,并使用基于注意力机制的 TPV 编码器实现了显著的提升。模型可以通过稀疏监督有效预测语义占用,仅使用相机输入在 LiDAR 分割任务上可实现与基于 LiDAR 的方法相当的性能。