利用精准提议和形状重建的单目 3D 物体检测
提出了一种名为 MonoRUn 的检测框架,该框架通过自我监督学习,仅使用简单的三维边界框注释学习密集的对应关系和几何学,并利用不确定性感知的区域重建网络来回归像素相关的三维目标坐标,并利用预测的不确定性通过整个下游模块,实现对象姿态的估计和协方差,实验表明该方法在 KITTI 基准测试中优于当前最先进的方法。
Mar, 2021
本研究提出了一种基于几何关系的 monocular 三维物体检测方法,通过单独的三维区域建议网络和深度感知卷积层,能够有效地改善基于图像的三维物体检测在自动驾驶领域中的表现。在 KITTI 数据集上,与其他之前的方法相比,M3D-RPN 方法在单眼三维物体检测和俯视图检测任务中都表现出显著的性能提升。
Jul, 2019
该研究提出了一种新的统一框架,将单眼 RGB 图像中的目标检测问题分解为结构化多边形预测任务和深度恢复任务,并使用对象高度先验进行反向投影变换,进一步纠正 3D 检测结果并取得了最先进的检测准确度。
Feb, 2020
本篇研究提出了一种基于关键点的方法,利用单个 RGB 图像进行三维目标检测和定位,该网络基于 2D 关键点检测和几何推理方法,同时估计 2D 特征和全局 3D 姿态,最终在 KITTI 数据集中达到了最好的性能表现。
May, 2019
该研究提出了一种基于深度神经网络和形态感知的三维目标检测方法,利用二维关键点和对应的三维坐标以及二维 / 三维的几何约束提高检测性能,并在公共数据集 KITTI 上实现了最新的性能。
Aug, 2021
我们提出了一种名为 DOPS 的快速单级 3D 物体检测方法,其核心创新点是一种快速、单次遍历的体系结构,同时检测 3D 物体并估计其形状。该方法通过图卷积进行聚合,并将 3D 边界框参数传入网络分支以预测表示每个检测到的物体形状的潜变量代码,因此我们的模型能够在没有目标数据集的地面真实形态信息的情况下提取物体形状。与现有技术相比,在 ScanNet 场景的目标检测中,我们的方法实现了约 5% 的技术进步,在 Waymo 开放数据集中实现了高达 3.4% 的技术进步,同时重现了检测到的汽车的形状。
Apr, 2020
本文提出了一种从单一 RGB 图像中检测和重构多个 3D 物体的方法,通过逐步优化检测、对齐和形状重构,选择最佳的几个候选形状,并采用轻量化的重构技术进行快速、端到端的训练。
Dec, 2020
通过引入 SS3D 方法,成功在单目图像中实现三维物体检测,并通过建模异方差性提高了基准性能。该方法在保持简洁的同时,达到了当前状态下最高的检测精度,是实现自主驾驶等领域高性能检测的可靠框架。
Jun, 2019
提升单目深度学习算法中对于三维场景物体检测的表现,通过伪 LIDAR 点云实现与 LIDAR 算法的融合,最终在 KITTI 基准测试中取得了最优结果。
Mar, 2019
本文提出了一种深度学习方法,它可以通过端到端的单目 3D 物体检测和度量形状检索,通过提出新的损失公式将 2D 检测、方向和尺度估计提升到 3D 空间,并在 KITTI3D 数据集上展示了与其他强大单目方法和新的最佳结果相比,对 6D 姿态和纹理度量几何学的实例恢复表现出了优异的结果。
Dec, 2018