基于视觉惯性 SLAM 的深度估计
本文提出一种利用相机运动和视觉惯性测距系统估算的稀疏深度来推断密集深度的方法,采用预测性跨模态标准,通过构建场景的分段平面脚手架来推断密集深度,并在 KITTI 深度完成基准上表现出最先进的性能。
May, 2019
我们提出了一种实时的基于视觉惯性的稠密建图方法,可使用顺序单眼图像和惯性测量单元(IMU)读数进行增量式三维网格重建,并提出了稀疏点辅助的多视角深度学习神经网络 (SPA-MVSNet),即使在噪声密集的情况下也能实现高质量的 3D 网格重建。
Jun, 2023
本文研究如何利用法线估计模型和预测的法线图提高深度质量,方法包括联合学习多视角法线估计和深度估计模块以及提出一种新的一致性损失来训练一个独立的一致性模块来细化深度 / 法线对。实验结果表明,该方法具有高精度、平滑等优点,在多个数据集上的表现均优于现有技术。
Nov, 2019
本文提出了一种统一的 CNN 框架来规范化深度完成,通过模拟深度与表面法线之间的几何约束,预测稀疏 LiDAR 输入的置信度,以隔离噪声的影响,以实现从稀疏深度图恢复密集深度图的目标,我们在 KITTI 深度完成数据集和 NYU-Depth-V2 数据集上进行了大量实验,证明了我们的方法达到了最先进的性能。
Oct, 2019
通过假设 3D 场景由分段平面组成,本文提出了针对单目深度估计和补全任务的新型物理(几何)推动深度学习框架。我们通过估计表面法线和平面到原点的距离图或补全稀疏表面法线和距离图作为中间输出,提出了一个法线 - 距离模块。同时,通过开发出平面感知一致性约束来规范化表面法线和距离图,并将其转换为深度图。此外,还集成了一个额外的深度模块来增强所提出框架的鲁棒性。在 NYU-Depth-v2、KITTI 和 SUN RGB-D 数据集上的大量实验表明,我们的方法在单目深度估计和补全任务方面胜过了先前的最先进竞争方法。
Nov, 2023
本文提出了一个深度神经网络架构,通过从单个彩色图像和稀疏深度产生准确的密集深度,实现了室外场景的景深感知。该网络以表面法向量为中间表示来产生密集深度,并可进行端到端的训练。利用修改后的编解码器结构,该网络有效地融合了密集的彩色图像和稀疏的 LiDAR 深度。
Dec, 2018
本文论述了如何通过使用 RGB-D 原始数据,采用单个深度回归网络来学习来自稀疏深度范例的密集深度估计,并研究了样本数量对预测准确性的影响,提出的算法有两个应用:转换稀疏地图为密集地图和 LiDAR 的超分辨率。
Sep, 2017
本文提出了一种用于估计一致密集深度图和相机姿态的算法,该算法基于学习的深度先验和几何优化相结合,不需要输入相机姿态,并能够在包括噪声、抖动、运动模糊和卷帘快门失真等多种挑战性条件下实现稳健的重建。
Dec, 2020
基于物理驱动的深度学习框架用于单目深度估计,通过假设 3D 场景由分段平面组成,提出了一种新的正常 - 距离头来推导每个位置的深度,同时,通过开发的面感知一致性约束对正常和距离进行规范化,并引入了额外的深度头来改善框架的鲁棒性,利用有效的对比迭代细化模块根据深度的不确定性互补地对深度进行精细化改进,实验证明该方法在 NYU-Depth-v2、KITTI 和 SUN RGB-D 数据集上超过了现有的最先进竞争方法,值得注意的是,它在 KITTI 深度预测在线基准测试中的提交时间中排名第一。
Sep, 2023
本文提出了一种基于光流和稀疏深度先验的方法,将动态场景模型假设为分段平面模型,计算其局部刚性变换和尽可能刚性的全局变换,无需显式估计 3D 旋转和平移即可高效恢复场景的深度密集图,适用于广泛的场景。
Feb, 2019