全局到局部三维重建的二维监督单目三维物体检测

Jun, 2023

全局到局部三维重建的二维监督单目三维物体检测

2D Supervised Monocular 3D Object Detection by Global-to-Local 3D Reconstruction

Jiawei He, Yuqi Wang, Yuntao Chen, Zhaoxiang Zhang

TL;DR本研究提出了一种新的逆向学习范式，称为 BA^2-Det，利用全局到局部 3D 重建的思想，对二维监督单目三维物体检测进行学习，实验结果显示 BA^2-Det 的性能与完全监督方法相当，并且甚至优于某些先驱的完全监督方法。

Abstract

With the advent of the big model era, the demand for data has become more important. Especially in monocular 3d object detection, expensive manual annotations potentially limit further developments. Existing works have investigated →

monocular 3d object detection weakly supervised algorithms global-to-local 3d reconstruction doubleclustering algorithm waymo open dataset

发现论文，激发创造

可学习的物体中心全局优化在 3D 视频物体检测中的应用

该研究探讨了长期时间视觉对应优化在三维视频对象检测中的应用，提出了具有目标中心时间对应学习和特征度量对象绑定调整的 BA-Det，取得了各种设置下基线 3D 检测器的 SOTA 性能。

Mar, 2023

SGM3D: 双目引导下的单目三维物体检测

本文提出了一种名为 SGM3D 的新方法，通过引入多粒度域自适应和基于 IoU 匹配的对齐方法，将立体 3D 特征适应到单眼检测中，显著提高了检测性能。实验证明，该方法在 KITTI 和 Lyft 数据集上取得了最先进的结果。

Dec, 2021

激光雷达引导半监督主动学习的单目三维物体检测

本文提出了一种新颖的半监督主动学习 (SSAL) 框架，用于配备了激光雷达的单目 3D 物体检测，利用了模型开发过程中所收集的所有数据的多模态。通过利用激光雷达来指导单目 3D 检测器的数据选择和训练，不在推理阶段引入任何开销，并采用半监督学习中的激光雷达教师，单目学生交叉模态框架，用于从未标记数据中蒸馏信息作为伪标签，以处理传播噪声等问题。文中也给出了用于选择需标记样本的传感器一致性基础选择评分的解决方案，同时也符合训练目标。本文在 KITTI 和 Waymo 数据集上广泛实验，验证了所提出方法的有效性。具体来说，所提出的选择策略在成本节省方面始终优于现有主动学习基线，在标签成本上节约了高达 17% 的成本；训练策略在 KITTI 3D 和 BEV 单目物体检测官方基准中获得了最佳成绩，将 BEV 平均精度提高了 2.02。

Jul, 2023

回到现实：基于形状引导标签增强的弱监督三维物体检测

提出了一种基于虚拟场景的弱监督方法用于 3D 物体检测，利用合成的 3D 形状将弱标签转换成更强的虚拟场景，并再次利用虚拟标签去改善真实标签和更好地训练检测器，同时提出了更具挑战性的室内 3D 物体检测基准测试。

Mar, 2022

多层次视觉引导的弱监督 3D 目标检测

对于弱监督的三维物体检测任务，本文提出了一种框架来研究如何在无需任何三维标签的情况下利用二维和三维领域之间的约束，通过三种视角的视觉数据建立二维和三维领域之间的关联。实验证明，在无需使用任何三维标签的情况下，该方法在 KITTI 数据集上取得了与最先进方法相媲美的性能。

Dec, 2023

视角到标签：自监督三维物体检测的多视角一致性

提出了一种基于多视角和弱标签的纯 RGB 序列的自监督 3D 物体检测方法，其在 KITTI 3D 数据集上的性能与使用激光雷达或立体图像的最先进的自监督方法相当。

May, 2023

WeakM3D：面向弱监督的单目三维物体检测

本文介绍了一种采用弱监督学习的单目三维目标检测方法，该方法利用生成的二维框选择对应的区域兴趣 LiDAR 点作为弱监督信号，并通过网络预测可以紧密对齐相应区域兴趣 LiDAR 点的三维框，从而消除了对三维框标注的依赖。

Mar, 2022

基于激光雷达点云辅助的单目三维物体检测

通过使用粗略标签和无标签雷达点云伪标签，LPCG 可以在自动驾驶系统中显著降低标注成本或显著提高检测准确性，在 KITTI 基准测试和 Waymo 基准测试中都取得了很好的效果。

Apr, 2021

利用 2D 边界框监督改善远距离 3D 物体检测

使用仅有的 2D 监督信息，我们提出了 LR3D 框架，通过学习远距离物体的深度估计，并使得基于相机的方法能够在 200 米以上的距离实现与完整 3D 监督相当的准确性。

Mar, 2024

Perceiver 算法进行的带有边界框去噪的单目三维物体检测

该研究提出了一种名为 MonoXiver 的方法，可通过组合 2D 到 3D 和 3D 到 2D 的信息流，使用 3D 空间局部网格搜索方式，实现单眼 3D 物体检测的 3D 中心定位。该方法使用 Perceiver I / O 模型，融合了几何信息和 2D 外观信息以学习去噪特征。在 KITTI 和 Waymo 数据集上的实验表明，MonoXiver 能在有限的计算开销下实现持续改进。

Apr, 2023