Mar, 2024

VRSO:用于静态物体标注的视觉中心重建

TL;DR该论文介绍了 VRSO,一种用于静态物体注释的基于视觉的方法,它使用相机图像作为输入,可以在 3D 空间中恢复静态物体,并基于自动重建和注释流程生成用于静态对象检测任务的 GT,其平均重投影误差仅为 2.6 像素,约为 Waymo 标注的四分之一(10.6 像素)。