基于相机运动和物体检测的深度估计

CVPRMar, 2021

基于相机运动和物体检测的深度估计

Depth from Camera Motion and Object Detection

Brent A. Griffin, Jason J. Corso

TL;DR本文通过设计一种循环神经网络（DBox）和引入 ODMD 数据集解决了物体深度估算问题，ODMD 基准测试包括 4 个验证和测试集，不仅在物体检测和机器人领域中取得了最先进的结果，而且可以使用手机相机估算物体的深度。

Abstract

This paper addresses the problem of learning to estimate the depth of detected objects given some measurement of camera motion (e.g., from robot kinematics or vehicle odometry). We achieve this by 1) designing a recurrent neural network (DBox) that estimates the depth of objects using

depth estimation object detection recurrent neural network camera motion dataset

发现论文，激发创造

从相机运动和视频对象分割学习物体深度

本论文致力于解决如何从摄像机测量的数据中，使用视频目标分割技术学习估计物体深度的问题，为此我们首先引入了一个多样化的，可扩展的数据集，其次设计了一种新颖的深度学习网络，该网络仅使用分割掩模和不合格的摄像机运动即可估计物体深度，我们的方法可以通过机器人和车载摄像头，在不同领域进行定位目标和避开障碍物的实验。

Jul, 2020

基于运动深度的单眼三维物体检测

通过研究基于单目输入的三维物体感知，提出了一种利用相机自运动提供的强几何结构进行精确物体深度估计和检测的方法，并建立了一个名为 “DfM” 的框架，成功地提高了 KITTI 基准数据集上的检测性能。

Jul, 2022

DepthMOT：深度线索引导强大的多目标追踪器

通过实现深度感知和相机姿态估计，本文提出了 DepthMOT 算法，可以准确区分多个对象，并解决了拥挤场景中物体混淆和相机运动不规则导致的 ID 切换问题。在 VisDrone-MOT 和 UAVDT 数据集上的广泛实验表明 DepthMOT 具有卓越性能。

Apr, 2024

视频中的自监督物体运动和深度估计

本文提出了一种自监督学习框架，从视频中估算单个对象的运动和单眼深度，并将对象运动建模为六个自由度刚体变换；此外，该方法还使用实例分割掩码引入对象信息，并通过引入新的几何约束损失项消除运动预测的尺度歧义，实验结果表明，该框架在不需要外部注释的情况下处理数据并能够捕捉对象的运动，与自监督研究方法相比，在 3D 场景流预测方面有更好的表现，对动态区域的视差预测也有所贡献。

Dec, 2019

用于单目三维物体检测的分类深度分布网络

提出了一种 Categorical Depth Distribution Network (CaDDN) 的解决方案，用于解决单目三维目标检测中的深度估计问题。在 KITTI 3D 目标检测基准测试中排名第一，同时也提供了用于 CaDDN 的代码发布。

Mar, 2021

通过级联深度估计和校准实现准确的基于摄像头的 3D 物体检测

本文提出了一个基于相机的 3D 目标检测的级联框架，通过深度估计和深度校准来有效地学习深度信息，实现从 2D 到 3D 空间的特征提取和目标定位。在多个检测器上进行广泛实验，取得了较高的性能表现。

Feb, 2024

关注和对比学习的联合深度和运动场估计

通过一种自监督学习框架，提出一种基于动态关注模块的两阶段投影管道，以明确解耦相机自我运动和物体运动，并提出了一种基于对比采样一致性的物体运动场估计方法，该方法在自监督单目深度估计、物体运动分割、单目场景流估计和视觉里程表任务上均优于现有的最先进算法。

Oct, 2021

基于全卷积网络的快速鲁棒单目深度估计用于障碍物检测

本文介绍了一种基于外观的障碍物检测系统，使用深度神经网络的方法进行训练，能够在高速行驶、长距离、低维度等复杂情况下对障碍物进行检测。

Jul, 2016

使用深度学习和几何学进行 3D 边界框估计

本文提出了一种使用单张图片进行三维目标检测与姿态估计的方法，通过使用深度卷积神经网络来回归相对稳定的三维目标属性，并使用二维边界框提供的几何约束来组合这些估计，从而产生完整的三维边界框。

Dec, 2016

利用投影建模学习基于几何引导的深度，实现单目三维物体检测

本篇研究提出一种基于几何建模的投影模型方法，用于改进单目三维物体检测中的深度估计问题，实验证明该方法使得检测性能得到了显著提升。

Jul, 2021