ICCVAug, 2023

MonoNeRD: NeRF 式的单目三维物体检测表示

TL;DR在单目三维检测领域,为了提高检测性能常常使用场景几何线索,然而现有的方法明确采用这些线索,例如估计深度图并将其反投影到三维空间。为了缓解这个问题,我们提出了 MonoNeRD,这是一个能够推断密集三维几何和占用的新型检测框架,我们将场景建模为有符号距离函数(SDF),利用体素渲染恢复 RGB 图像和深度图。据我们所知,这项工作首次将体素渲染引入到单目三维检测中,并展示了基于隐式重构的图像三维感知的潜力。在 KITTI-3D 基准和 Waymo 开放数据集上进行的大量实验证明了 MonoNeRD 的有效性。代码可在此 URL 上找到。