We present multi-view attentive contextualization (MvACon), a simple yet
effective method for improving 2d-to-3d feature lifting in query-based
multi-view 3D (MV3D) object detection. Despite remarkable progress w
该论文研究了自动驾驶场景下高精度的 3D 物体检测问题。其提出了 Multi-View 3D networks(MV3D)框架,该框架采用多传感器融合技术,将 LIDAR 点云和 RGB 图像作为输入,并预测有方向的 3D 界限框。实验表明,该方法在 3D 定位和 3D 检测任务方面的表现优于现有技术约 25%和 30%,在 2D 检测中也表现出显著的技术优势。