单视图弱监督单目 3D 检测

Feb, 2024

Weakly Supervised Monocular 3D Detection with a Single-View Image

Xueying Jiang, Sheng Jin, Lewei Lu, Xiaoqin Zhang, Shijian Lu

TL;DR利用深度信息，无需任何三维标注或其他训练数据，SKD-WM3D 提出了一种弱监督的单目三维检测框架，通过融合深度信息将图像特征转化为三维表示，有效地消除了单目场景中的深度歧义。实验证明，SKD-WM3D 明显超过了最先进的方法，甚至与许多全监督方法相媲美。

Abstract

monocular 3d detection (M3D) aims for precise 3D object localization from a single-view image which usually involves labor-intensive annotation of 3D detection boxes. →

monocular 3d detection weakly supervised self-knowledge distillation depth information single-view image

发现论文，激发创造

WeakM3D：面向弱监督的单目三维物体检测

本文介绍了一种采用弱监督学习的单目三维目标检测方法，该方法利用生成的二维框选择对应的区域兴趣 LiDAR 点作为弱监督信号，并通过网络预测可以紧密对齐相应区域兴趣 LiDAR 点的三维框，从而消除了对三维框标注的依赖。

Mar, 2022

使用多视角投影和方向一致性进行弱监督单目 3D 对象检测

本文提出了一种基于弱监督学习的单目 3D 物体检测方法，该方法只使用图像上标记的 2D 标签进行模型训练，并探索了投影、多视图和方向这三种不同类型的一致性约束以及设计了一种新的 2D 方向标记方法用于准确的旋转方向预测。实验证明，该方法在一些完全监督方法上具有可比较的性能，并且当用作预训练方法时，仅使用 1 / 3 3D 标签就可以显着优于对应的完全监督基线。

Mar, 2023

使用几何约束嵌入和半监督训练的单目 3D 检测

KM3D-Net 提出了一种基于 RGB 图像和关键点的单次检测框架，通过结合完全卷积模型、几何约束和不依赖 CAD 模型、深度生成器，以及一种有效的半监督训练策略，实现了卓越的检测表现，并超过以前所有的最先进方法。

Sep, 2020

多层次视觉引导的弱监督 3D 目标检测

对于弱监督的三维物体检测任务，本文提出了一种框架来研究如何在无需任何三维标签的情况下利用二维和三维领域之间的约束，通过三种视角的视觉数据建立二维和三维领域之间的关联。实验证明，在无需使用任何三维标签的情况下，该方法在 KITTI 数据集上取得了与最先进方法相媲美的性能。

Dec, 2023

ODM3D：缓解前景稀疏性以提升半监督单目三维物体检测

通过半监督学习，利用大量未标记的数据，我们提出了 ODM3D 框架，通过跨模态知识蒸馏和新增的数据增强策略来提高单眼 3D 物体检测器的性能，取得了在 KITTI 验证和测试基准上的第一名成绩，显著超过所有现有的单眼方法（监督或半监督）在 BEV 和 3D 检测指标上。

Oct, 2023

面向单目 3D 物体检测的深度通用化

提出了一种基于 MoVi-3D 的深度学习架构，使用几何信息生成虚拟视图对单目 RGB 进行 3D 物体检测，与传统方法相比，成功削减了视觉差异性导致的深度学习复杂度，从而取得了 KITTI3D 基准测试的新的最优结果。

Dec, 2019

SGM3D: 双目引导下的单目三维物体检测

本文提出了一种名为 SGM3D 的新方法，通过引入多粒度域自适应和基于 IoU 匹配的对齐方法，将立体 3D 特征适应到单眼检测中，显著提高了检测性能。实验证明，该方法在 KITTI 和 Lyft 数据集上取得了最先进的结果。

Dec, 2021

基于点云的弱监督三维物体检测

本文提出 VS3D，一个从点云中弱监督学习的 3D 目标检测框架，其中引入了无监督的 3D proposal 模块和跨模态知识蒸馏策略，在 KITTI 数据集上取得了优异的性能。

Jul, 2020

单目 3D 物体检测的跨模态知识蒸馏网络

本研究提出了一种基于 Cross-Modality Knowledge Distillation (CMKD) 的半监督训练框架，通过跨模态知识蒸馏能够从大规模未标记数据中有效传输 LiDAR 模态到图像模态的知识，从而显著提高单目三维检测性能，使得该方法在 KITTI 测试集和 Waymo 验证集上的表现明显优于先前最先进的方法。

Nov, 2022

自监督的单目可微渲染用于 3D 物体检测

本研究提出了一种基于自监督的方法，利用强形状先验和二维实例掩模来重建带纹理的三维物体并进行姿态估计，通过可微分渲染和先前预训练的单目深度估计网络推断图像中每个物体的三维位置和网格信息，实验结果表明本方法有效地利用嘈杂的单目深度和可微分渲染来代替昂贵的 3D 地面真值标签或激光雷达信息。

Sep, 2020