单目三维物体检测的单应性损失
本文提出了一种考虑成对样本关系来改进单目三维物体检测的方法,包括计算对象对之间的不确定性感知预测和利用非线性最小二乘方法对其进行优化,实验结果表明,该方法在 KITTI 三维检测基准测试中表现最佳。
Mar, 2020
该研究提出了一种通过单个 RGB 图像实现单目 3D 物体检测的方法,采用新颖的去耦合转换来实现 2D 和 3D 检测损失,以及一种新颖的自监督置信度分数来实现 3D 边界框。该方法通过隔离参数组对给定损失的贡献来解决了复杂互动参数存在的问题。同时,作者还通过改善 2D 检测结果的有符号交并比驱动损失来应用了损失去耦合。通过基于 KITTI3D 和 nuScenes 数据集的广泛实验评估和消融研究,该方法在车类别目标检测方面实现了新的最优成果。
May, 2019
通过引入 SS3D 方法,成功在单目图像中实现三维物体检测,并通过建模异方差性提高了基准性能。该方法在保持简洁的同时,达到了当前状态下最高的检测精度,是实现自主驾驶等领域高性能检测的可靠框架。
Jun, 2019
提出一种基于凸多边形的全可微分算法,用于计算任意角度下两个三维边界框的 IoU,并利用该算法在三种最先进的视角不可知的三维检测模型上进行实验,结果表明提出的多边形 IoU 损失(PIoU 损失)收敛速度比 L1 损失更快,并且在三维检测模型中,PIoU 损失与 L1 损失的组合比单独使用 L1 损失时获得更好的结果(对于汽车的 MonoCon,AP70 提高了 1.64%,对于汽车的 RTM3D,AP70 提高了 0.18%,对于骑自行车的 MonoRCNN,AP50/AP25 分别提高了 0.83%/2.46%)。
Sep, 2023
本文从定位误差的角度出发,找出了导致单目三维检测受限的主要因素,并提出了三种策略。在 KITTI 数据集上的实验结果表明,所提出的方法实现了实时检测,并且表现远超过以往的同类方法。
Mar, 2021
该研究提出了一种新的统一框架,将单眼 RGB 图像中的目标检测问题分解为结构化多边形预测任务和深度恢复任务,并使用对象高度先验进行反向投影变换,进一步纠正 3D 检测结果并取得了最先进的检测准确度。
Feb, 2020
提出了一种基于多摄像头的 3D 对象检测框架,使用基于上下文注意力的网络,直接在 3D 空间中进行边界框的预测,实现了全球最佳性能。
Oct, 2021
本篇研究提出一种基于几何建模的投影模型方法,用于改进单目三维物体检测中的深度估计问题,实验证明该方法使得检测性能得到了显著提升。
Jul, 2021
本篇研究提出了一种基于关键点的方法,利用单个 RGB 图像进行三维目标检测和定位,该网络基于 2D 关键点检测和几何推理方法,同时估计 2D 特征和全局 3D 姿态,最终在 KITTI 数据集中达到了最好的性能表现。
May, 2019
通过研究路面对 3D 检测提供的额外信息,提出了一种嵌入式神经网络,能够充分利用这些应用程序特定的先验知识,从而实现使用单个 RGB 摄像机确定环境中对象的位置和方向的三维目标检测。
Feb, 2021