单目三维物体检测的单应性损失

CVPRApr, 2022

Homography Loss for Monocular 3D Object Detection

Jiaqi Gu, Bojian Wu, Lubin Fan, Jianqiang Huang, Shen Cao...

TL;DR本文提出了一种新的单目三维目标检测方法，通过考虑物体间的几何关系，探索它们的相互关系来更好地估计三维框，并使用检测到的二维框来全局约束相应的三维框的优化，通过提出的可微分损失函数（Homography Loss）来实现这一目标。实验证明，该方法表现出比其他最先进的方法在 KITTI 3D 数据集上具有更好的性能。

Abstract

monocular 3d object detection is an essential task in autonomous driving. However, most current methods consider each 3D object in the scene as an independent training sample, while ignoring their inherent geometric relations, thus inevitably resulting in a lack of leveraging

monocular 3d object detection spatial constraints 2d detection homography loss kitti 3d datasets

发现论文，激发创造

MonoPair: 使用成对空间关系的单目 3D 物体检测

本文提出了一种考虑成对样本关系来改进单目三维物体检测的方法，包括计算对象对之间的不确定性感知预测和利用非线性最小二乘方法对其进行优化，实验结果表明，该方法在 KITTI 三维检测基准测试中表现最佳。

Mar, 2020

单目三维物体检测分离

该研究提出了一种通过单个 RGB 图像实现单目 3D 物体检测的方法，采用新颖的去耦合转换来实现 2D 和 3D 检测损失，以及一种新颖的自监督置信度分数来实现 3D 边界框。该方法通过隔离参数组对给定损失的贡献来解决了复杂互动参数存在的问题。同时，作者还通过改善 2D 检测结果的有符号交并比驱动损失来应用了损失去耦合。通过基于 KITTI3D 和 nuScenes 数据集的广泛实验评估和消融研究，该方法在车类别目标检测方面实现了新的最优成果。

May, 2019

使用交并比损失端到端训练的单目 3D 物体检测与盒式拟合

通过引入 SS3D 方法，成功在单目图像中实现三维物体检测，并通过建模异方差性提高了基准性能。该方法在保持简洁的同时，达到了当前状态下最高的检测精度，是实现自主驾驶等领域高性能检测的可靠框架。

Jun, 2019

视点不受限的单目三维车辆检测中的多边形交并比损失

提出一种基于凸多边形的全可微分算法，用于计算任意角度下两个三维边界框的 IoU，并利用该算法在三种最先进的视角不可知的三维检测模型上进行实验，结果表明提出的多边形 IoU 损失（PIoU 损失）收敛速度比 L1 损失更快，并且在三维检测模型中，PIoU 损失与 L1 损失的组合比单独使用 L1 损失时获得更好的结果（对于汽车的 MonoCon，AP70 提高了 1.64%，对于汽车的 RTM3D，AP70 提高了 0.18%，对于骑自行车的 MonoRCNN，AP50/AP25 分别提高了 0.83%/2.46%）。

Sep, 2023

单目三维物体检测中定位误差研究

本文从定位误差的角度出发，找出了导致单目三维检测受限的主要因素，并提出了三种策略。在 KITTI 数据集上的实验结果表明，所提出的方法实现了实时检测，并且表现远超过以往的同类方法。

Mar, 2021

基于解耦结构化多边形估计和高度引导深度估计的单目三维物体检测

该研究提出了一种新的统一框架，将单眼 RGB 图像中的目标检测问题分解为结构化多边形预测任务和深度恢复任务，并使用对象高度先验进行反向投影变换，进一步纠正 3D 检测结果并取得了最先进的检测准确度。

Feb, 2020

通过 3D 到 2D 查询从多视角图像中进行 3D 物体检测

提出了一种基于多摄像头的 3D 对象检测框架，使用基于上下文注意力的网络，直接在 3D 空间中进行边界框的预测，实现了全球最佳性能。

Oct, 2021

利用投影建模学习基于几何引导的深度，实现单目三维物体检测

本篇研究提出一种基于几何建模的投影模型方法，用于改进单目三维物体检测中的深度估计问题，实验证明该方法使得检测性能得到了显著提升。

Jul, 2021

基于关键点几何推理的单目三维物体检测

本篇研究提出了一种基于关键点的方法，利用单个 RGB 图像进行三维目标检测和定位，该网络基于 2D 关键点检测和几何推理方法，同时估计 2D 特征和全局 3D 姿态，最终在 KITTI 数据集中达到了最好的性能表现。

May, 2019

自动驾驶用基于地面的单目三维物体检测

通过研究路面对 3D 检测提供的额外信息，提出了一种嵌入式神经网络，能够充分利用这些应用程序特定的先验知识，从而实现使用单个 RGB 摄像机确定环境中对象的位置和方向的三维目标检测。

Feb, 2021