构建单目物体 - SLAM 的类别特定模型

Feb, 2018

构建单目物体 - SLAM 的类别特定模型

Constructing Category-Specific Models for Monocular Object-SLAM

Parv Parkhiya, Rishabh Khawad, J. Krishna Murthy, Brojeshwar Bhowmick, K. Madhava Krishna

TL;DR提出了一种基于类别级别模型的单目相机实时目标 SLAM 的新范例，利用 CAD 集合构建类别级别模型以帮助设计目标地标观察，并在大数据合成方法中学习对象变形和判别特征，从而在实时场景中可以估算物体形状及位置，并帮助进行增强现实应用的物体实例检索。

Abstract

We present a new paradigm for real-time object-oriented slam with a monocular camera. Contrary to previous approaches, that rely on object-level models, we construct →

real-time slam monocular camera category-level models object landmark observations

发现论文，激发创造

实时单目物体感知稀疏 SLAM

本文在单目 SLAM 框架中嵌入了实时深度学习的目标检测器，将普通物体表示为四面体，进一步细化物体重建，检测附加平面标志并建模为独立地标志，可大幅提高系统的定位性能和语义地图的丰富程度。

Sep, 2018

实时单目目标 SLAM

本文提出一种实时基于物体的 SLAM 系统，利用至今最大的物体数据库，包括一个单目 SLAM 算法，该算法利用可变形物体约束来改善地图并找到其实际比例，和一种新颖的基于二进制词袋的物体识别算法，提供 500 个三维物体的实时检测。

Apr, 2015

CubeSLAM：单目三维物体 SLAM

本文介绍了一种方法，用于在静态和动态环境下单个图像的三维立方体物体检测和多视图对象 SLAM，并展示了两个部分如何互相改进，对单个图像物体检测，我们从 2D 边界框和消失点采样中生成高质量的 cuboid 提议，并根据与图像边缘的对齐性对提议进行进一步评分和选择。其次，提出了新的对象测量的多视图束调整，以联合优化相机，对象和点的姿态。对象可以提供长程几何和尺度约束，以改善相机姿态估计并减少单眼漂移。而不是将动态区域视为异常值，我们利用对象表示和运动模型约束来改善相机姿态估计。在 SUN RGBD 和 KITTI 上进行的 3D 检测实验证明了与现有方法相比更高的准确性和鲁棒性。在公共 TUM，KITTI 测距和我们自己收集的数据集上，我们的 SLAM 方法实现了最先进的单眼相机姿态估计，同时提高了 3D 对象检测的准确性。

Jun, 2018

单目 SLAM 支持下的物体识别

本文研究了一种单目 SLAM 感知的目标识别系统，该系统利用多视图对象提议和高效特征编码等方法，能够在几乎恒定的时间内使用单个 RGB 相机检测和识别环境中的对象。实验结果表明，该系统具有强大的识别功能，并在 UW RGB-D 数据集上表现出可扩展的运行时性能优势。

Jun, 2015

从单个图像中重建特定类别的物体

本文介绍了一种基于像素输入和 3D 刚性类别的输出的自动化流程，通过从现有物体检测数据集中学习可变形的 3D 模型并结合底层模块进行高频率形状细节恢复，实现了在单幅图像中获取真实场景下物体的三维表面重建，通过在最近引入的 PASCAL 3D + 数据集上的全面定量分析和消融研究展示了非常令人鼓舞的自动重建效果。

Nov, 2014

从运动学习骨骼类目的单目三维重建

使用视频自监督和模板形变技术来实现单目 3D 重建并且进行数值优化，以便使计算得出的模型更加准确和具有解释性。

Mar, 2021

结构化环境下的单目物体和平面 SLAM

本文提出一种使用高级物体和平面地标的单目同时定位与地图构建算法，该算法比基于特征点的 SLAM 建立的地图更加密集、更紧凑且更具语义意义。实验显示，我们的算法能够提高相机的定位精度，特别是在没有闭环的情况下，并且在许多结构化环境中稳健地生成密集地图。

Sep, 2018

通过观察学习 3D 物体类别

本篇论文旨在通过两种创新，基于从运动视角观察物体的方式，不需要手动注释，实现学习 3D 物体类别的传统方法。我们的系统基于两种创新：一种是具有鲁棒性的 Siamese 视点因子分解网络，可以对不同的视频进行对齐；另一种是可以从部分观测中提取对象的完整形状的 3D 形状完成网络。我们还演示了配置网络以执行概率预测和几何感知数据增强方案的好处。在公开可用的基准测试中，我们获得了最先进的结果。

May, 2017

从视频中重建可动画类别

利用可微分渲染实现从单个视频中生成人，猫和狗等动物的可动态三维模型，并通过优化特定的骨架实现实例化，使用潜在空间正则化鼓励类别间的共享结构并同时维护实例的细节和使用三维背景模型将对象与背景分离。

May, 2023

MoD-SLAM：无边界三维场景重建的单目稠密地图生成

MoD-SLAM 是一种基于神经网络的单目稠密建图方法，通过使用单目深度估计来优化场景重建，并利用闭环检测来更新相机姿态，实现实时在无边界场景中进行全局姿态优化和三维重建。与以往神经网络建图方法相比，我们的方法更加稳健、可扩展和多功能，在大型无边界场景中表现出更卓越的建图性能。

Feb, 2024