构建单目物体 - SLAM 的类别特定模型
本文在单目 SLAM 框架中嵌入了实时深度学习的目标检测器,将普通物体表示为四面体,进一步细化物体重建,检测附加平面标志并建模为独立地标志,可大幅提高系统的定位性能和语义地图的丰富程度。
Sep, 2018
本文提出一种实时基于物体的 SLAM 系统,利用至今最大的物体数据库,包括一个单目 SLAM 算法,该算法利用可变形物体约束来改善地图并找到其实际比例,和一种新颖的基于二进制词袋的物体识别算法,提供 500 个三维物体的实时检测。
Apr, 2015
本文介绍了一种方法,用于在静态和动态环境下单个图像的三维立方体物体检测和多视图对象 SLAM,并展示了两个部分如何互相改进,对单个图像物体检测,我们从 2D 边界框和消失点采样中生成高质量的 cuboid 提议,并根据与图像边缘的对齐性对提议进行进一步评分和选择。其次,提出了新的对象测量的多视图束调整,以联合优化相机,对象和点的姿态。对象可以提供长程几何和尺度约束,以改善相机姿态估计并减少单眼漂移。而不是将动态区域视为异常值,我们利用对象表示和运动模型约束来改善相机姿态估计。在 SUN RGBD 和 KITTI 上进行的 3D 检测实验证明了与现有方法相比更高的准确性和鲁棒性。在公共 TUM,KITTI 测距和我们自己收集的数据集上,我们的 SLAM 方法实现了最先进的单眼相机姿态估计,同时提高了 3D 对象检测的准确性。
Jun, 2018
本文研究了一种单目 SLAM 感知的目标识别系统,该系统利用多视图对象提议和高效特征编码等方法,能够在几乎恒定的时间内使用单个 RGB 相机检测和识别环境中的对象。实验结果表明,该系统具有强大的识别功能,并在 UW RGB-D 数据集上表现出可扩展的运行时性能优势。
Jun, 2015
本文介绍了一种基于像素输入和 3D 刚性类别的输出的自动化流程,通过从现有物体检测数据集中学习可变形的 3D 模型并结合底层模块进行高频率形状细节恢复,实现了在单幅图像中获取真实场景下物体的三维表面重建,通过在最近引入的 PASCAL 3D + 数据集上的全面定量分析和消融研究展示了非常令人鼓舞的自动重建效果。
Nov, 2014
本文提出一种使用高级物体和平面地标的单目同时定位与地图构建算法,该算法比基于特征点的 SLAM 建立的地图更加密集、更紧凑且更具语义意义。实验显示,我们的算法能够提高相机的定位精度,特别是在没有闭环的情况下,并且在许多结构化环境中稳健地生成密集地图。
Sep, 2018
本篇论文旨在通过两种创新,基于从运动视角观察物体的方式,不需要手动注释,实现学习 3D 物体类别的传统方法。我们的系统基于两种创新:一种是具有鲁棒性的 Siamese 视点因子分解网络,可以对不同的视频进行对齐;另一种是可以从部分观测中提取对象的完整形状的 3D 形状完成网络。我们还演示了配置网络以执行概率预测和几何感知数据增强方案的好处。在公开可用的基准测试中,我们获得了最先进的结果。
May, 2017
利用可微分渲染实现从单个视频中生成人,猫和狗等动物的可动态三维模型,并通过优化特定的骨架实现实例化,使用潜在空间正则化鼓励类别间的共享结构并同时维护实例的细节和使用三维背景模型将对象与背景分离。
May, 2023
MoD-SLAM 是一种基于神经网络的单目稠密建图方法,通过使用单目深度估计来优化场景重建,并利用闭环检测来更新相机姿态,实现实时在无边界场景中进行全局姿态优化和三维重建。与以往神经网络建图方法相比,我们的方法更加稳健、可扩展和多功能,在大型无边界场景中表现出更卓越的建图性能。
Feb, 2024