正常辅助立体深度估计
基于物理驱动的深度学习框架用于单目深度估计,通过假设 3D 场景由分段平面组成,提出了一种新的正常 - 距离头来推导每个位置的深度,同时,通过开发的面感知一致性约束对正常和距离进行规范化,并引入了额外的深度头来改善框架的鲁棒性,利用有效的对比迭代细化模块根据深度的不确定性互补地对深度进行精细化改进,实验证明该方法在 NYU-Depth-v2、KITTI 和 SUN RGB-D 数据集上超过了现有的最先进竞争方法,值得注意的是,它在 KITTI 深度预测在线基准测试中的提交时间中排名第一。
Sep, 2023
通过使用双目输入,引进左右一致性损失函数,并提出一种保存边缘特征的损失函数来改善测试时训练中的深度模糊问题,提出了一种稠密的双目视频深度估计方法,调研结果表明该模型精度可靠。
May, 2023
本研究提出一种基于卷积神经网络的单张图像深度估计方法,使用更容易获取的双目立体视觉图像替代需要大量对应地面真实深度数据的监督式回归训练,通过利用同一场景下两个视点的对极约束,生成视差图,并利用一种新的训练目标函数,结合左右两张图像的视差图像互相匹配和校准,提高了深度估计的性能表现,从而实现了在 KITTI 数据集上的单张图像深度估计的最新领先水平,甚至超过了基于真实深度训练的监督式方法。
Sep, 2016
通过假设 3D 场景由分段平面组成,本文提出了针对单目深度估计和补全任务的新型物理(几何)推动深度学习框架。我们通过估计表面法线和平面到原点的距离图或补全稀疏表面法线和距离图作为中间输出,提出了一个法线 - 距离模块。同时,通过开发出平面感知一致性约束来规范化表面法线和距离图,并将其转换为深度图。此外,还集成了一个额外的深度模块来增强所提出框架的鲁棒性。在 NYU-Depth-v2、KITTI 和 SUN RGB-D 数据集上的大量实验表明,我们的方法在单目深度估计和补全任务方面胜过了先前的最先进竞争方法。
Nov, 2023
提出了一种基于学习的多帧深度估计方法,通过引入组合法线图约束和遮挡感知策略,能更好地保留室内场景中的高曲率特征和全局平面区域,并优于其他算法在深度估计精度和保存几何特征方面的表现。
Apr, 2020
使用基于学生 - 教师策略、数据集成和立体信心引导回归损失的方法,可以提高单目深度估计的精度,并用于高级视觉任务,如室外场景的驾驶情境等。
Apr, 2019
本文研究了利用 VI-SLAM 系统从稀疏深度点云与室内场景图片中学习场景深度完成的问题,特别地,本文使用预训练的表面法向网络结合利用可用的重力估计来修正输入图像的视角限制,从而提高了表面法向估计和深度完成精度。最后,本文在 ScanNet、NYUv2 和 Azure Kinect 数据集上展示了我们的方法超越了其他最先进的方法。
Jul, 2020
本文提出了一种新的多视图立体(MVS)深度图计算优先级方法,该优先级方法在 MVS 算法执行之前进行两步操作,包括寻找匹配伙伴并根据观测质量对结果进行排名,另外还使用了一种基于机器学习的信心预测器,能够对图像星座的质量进行评估,并提出一种优先级方法来构建稳固的三维重建基础,实验表明使用该方法能够在文化遗产保护和建造重建领域中达到更好的重建质量。
Mar, 2018
在自动驾驶车辆的背景下,本文重新审视视觉深度估计问题。我们提出了一种新颖的半监督学习方法来训练深度立体神经网络,并提出了一种包含机器学习的 argmax 层和定制运行时的体系结构,可在嵌入式 GPU 上运行一个较小版本的我们的 Stereo DNN。在 KITTI 2015 立体数据集上展示了有竞争力的结果。
Mar, 2018
介绍了一种基于深度学习的多视角立体匹配系统,采用一种新型求解器,通过优化基于本地平面假设的能量潜力,迭代地求解每个视角的深度图和法向量图,并监测由定制的置信度地图产生的效果。
Jan, 2022