单目视频中的运动学三维物体检测

ECCVJul, 2020

单目视频中的运动学三维物体检测

Kinematic 3D Object Detection in Monocular Video

Garrick Brazil, Gerard Pons-Moll, Xiaoming Liu, Bernt Schiele

TL;DR提出了一种基于线性运动的单目视频三维物体检测方法，该方法通过将物体方向分解为两个部分并引入自平衡的三维置信度方法，有效地提高了三维定位精度，同时在 KITTI 自动驾驶数据集上取得了最好的表现。

Abstract

Perceiving the physical world in 3D is fundamental for self-driving applications. Although temporal motion is an invaluable resource to human vision for detection, tracking, and depth perception, such features have not been thoroughly utilized in modern 3D object detectors. In this wor

3d object detection monocular video kinematic motion localization precision self-driving

发现论文，激发创造

基于运动深度的单眼三维物体检测

通过研究基于单目输入的三维物体感知，提出了一种利用相机自运动提供的强几何结构进行精确物体深度估计和检测的方法，并建立了一个名为 “DfM” 的框架，成功地提高了 KITTI 基准数据集上的检测性能。

Jul, 2022

基于关键点几何推理的单目三维物体检测

本篇研究提出了一种基于关键点的方法，利用单个 RGB 图像进行三维目标检测和定位，该网络基于 2D 关键点检测和几何推理方法，同时估计 2D 特征和全局 3D 姿态，最终在 KITTI 数据集中达到了最好的性能表现。

May, 2019

单目三维车辆检测与跟踪

提出了一种基于单目视觉的 3D 车辆检测和跟踪的在线框架，并利用 3D 车辆坐标信息和深度匹配对数据进行关联，并设计了一个基于 LSTM 的动作学习模块，以进行更准确的长期运动外推。实验结果表明，该跟踪系统可以提供抗干扰性更强的数据关联和跟踪能力，并且在跟踪 30 米内的行驶车辆方面比基于激光雷达的方法表现更好。

Nov, 2018

用立体视觉进行语义化三维物体和自我运动跟踪，用于自动驾驶

本文提出了一种基于立体视觉的方法，用于在动态自动驾驶情景下跟踪摄像机姿态和三维语义对象，该方法使用易于标注的二维检测和离散视点分类结合轻量级语义推理方法获取粗略的三维物体测量，并基于当前的物体感知相机姿态跟踪实现物体位置的估计与 3D 建模以获得精确度和时间一致性。

Jul, 2018

自动驾驶用基于地面的单目三维物体检测

通过研究路面对 3D 检测提供的额外信息，提出了一种嵌入式神经网络，能够充分利用这些应用程序特定的先验知识，从而实现使用单个 RGB 摄像机确定环境中对象的位置和方向的三维目标检测。

Feb, 2021

单目三维物体检测：一种无外参方法

本篇论文提出了一种新颖的方法，通过检测消失点和地平线变化来预测摄像机的外部参数，从而解决了自动驾驶中相机外参引起的目标检测精度波动问题，并在 KITTI 3D 和 nuScenes 数据集上取得最好的性能表现。

Jun, 2021

旋转的重要性：针对不同相机系统的广义单目三维物体检测

通过对相机姿态变换的研究，我们发现 3D 物体检测性能在不同于训练数据所用相机系统的情况下明显降低。为了解决这个问题，我们提出了一个通用的 3D 物体检测方法，其中包括一个位置修正模块，用于校正估计的 3D 边界框位置和朝向，并在不进行额外训练的情况下，提高了 AP3D 得分（KITTI moderate，IoU > 70%）约 6 至 10 倍。定量和定性结果都验证了该方法的有效性。

Oct, 2023

面向单目 3D 物体检测的深度通用化

提出了一种基于 MoVi-3D 的深度学习架构，使用几何信息生成虚拟视图对单目 RGB 进行 3D 物体检测，与传统方法相比，成功削减了视觉差异性导致的深度学习复杂度，从而取得了 KITTI3D 基准测试的新的最优结果。

Dec, 2019

视频中的自监督物体运动和深度估计

本文提出了一种自监督学习框架，从视频中估算单个对象的运动和单眼深度，并将对象运动建模为六个自由度刚体变换；此外，该方法还使用实例分割掩码引入对象信息，并通过引入新的几何约束损失项消除运动预测的尺度歧义，实验结果表明，该框架在不需要外部注释的情况下处理数据并能够捕捉对象的运动，与自监督研究方法相比，在 3D 场景流预测方面有更好的表现，对动态区域的视差预测也有所贡献。

Dec, 2019

空中单目三维物体检测

通过双视图检测系统 DVDET，提出了一种基于地理变形的训练模块，实现了 2D 图像空间和 3D 物理空间的空中单目物体检测，并利用新的数据集 AM3D，证明了模型的可行性及性能。

Aug, 2022