分层膨胀卷积和软加权和推理的单目深度估计

Aug, 2017

分层膨胀卷积和软加权和推理的单目深度估计

Monocular Depth Estimation with Hierarchical Fusion of Dilated CNNs and Soft-Weighted-Sum Inference

Bo Li, Yuchao Dai, Mingyi He

TL;DR本文提出了一种利用深度学习解决复杂多物体单目深度估计问题的端到端学习框架，通过将单目深度估计表述为一种多类别密集标注任务以及采用软加权和推断方法等策略，实现了对多尺度深度信息的有效利用，降低了量化误差并提高了方法的鲁棒性。实验结果表明，该方法在 NYU Depth V2 数据集上表现优于当前最先进方法。

Abstract

monocular depth estimation is a challenging task in complex compositions depicting multiple objects of diverse scales. Albeit the recent great progress thanks to the deep convolutional neural networks (CNNs), the state-of-the-art →

monocular depth estimation end-to-end learning multi-category dense labeling soft-weighted-sum inference nyu depth v2

发现论文，激发创造

基于深度学习的单目深度估计：综述

该研究对基于深度学习的单张图像深度估计方法进行了调研，总结了常用的数据集、评价指标和不同的训练方式，并讨论了未来研究中的挑战和方向。

Mar, 2020

使用内部特征融合的自监督单目深度估计

本文提出了一种基于 HRNet 网络的深度估计网络 ——DIFFNet，它能在下采样和上采样过程中利用语义信息，并通过特征融合和注意力机制提高算法表现，实验结果表明，该方法在 KITTI 基准数据集上优于当前最先进的单目深度估计方法，并具有处理更高分辨率数据的潜力。我们还通过建立具有挑战性案例的测试集提出了额外的评估策略。

Oct, 2021

深入自监督单目室内深度估计

室内深度自动估计的自我监督学习是困难的，挑战主要集中在大面积低纹理区域和复杂的内部训练数据上。本文提出了一种名为 IndoorDepth 的新方法，包括两个创新点：首先，我们提出了一种改进的结构相似（SSIM）功能的新颖光度损失函数，用于应对低纹理区域的挑战；此外，为了进一步减轻不准确的自身运动预测问题，我们使用多个不同阶段的光度损失进行训练，以构建更深的姿态网络。通过对实验的深入研究，我们验证了每个新想法的有效性。在 NYUv2 基准测试中，我们的 IndoorDepth 方法在性能上超过了之前的最新方法。此外，我们还在 ScanNet 数据集上验证了我们的方法的泛化能力。

Dec, 2023

使用深度全卷积残差网络将单目图像深度估计视为分类问题

通过像素分类的方式实现单目图像深度估计，利用深度残差网络进行预测，同时采用全连接条件随机场 (CRF) 进一步提升效果。在室内和室外数据集上实现了最先进的性能表现。

May, 2016

使用多尺度连续 CRFs 作为顺序深度网络进行单目深度估计

本文提出了一种基于多尺度卷积神经网络、条件随机场及其连续形式的深度学习模型，用于单张静态图片的单目深度估计，该模型使用连续性的 CRF 完成深度估计，同时提出两个不同的变体，其中一个建立了多个 CRF 级联模型，另一个提出了一种结合模型；最后，作者在 NYUD-V2、Make3D 和 KITTI 等公共数据集上进行了大量实验，结果表明所提出方法得以有效地实现，并取得了目前最新的研究成果。

Mar, 2018

单目深度估计卷积神经网络的可视化

通过对卷积神经网络的可视化，利用优化问题识别最少的图像像素来实现单张图像的深度推断，该方法在室内和室外场景数据集上得到了有效应用，结果有助于探究如何通过卷积神经网络从单张图像中推断深度的问题。

Apr, 2019

CNN-SLAM: 实时稠密单目 SLAM 与深度预测学习

本文研究了如何利用卷积神经网络深度预测图来进行准确而密集的单目重建，并提出了一种将 CNN 预测的密集深度图与直接单目 SLAM 测量所获得的深度测量自然融合的方法，证明了这种方法在场景重建绝对尺度估计等方面的鲁棒性和准确性。最终，提出了一个将语义标签与单个帧的密集 SLAM 高效融合的框架，能够从单个视图中获得语义一致的场景重建。

Apr, 2017

OmniFusion: 基于几何感知融合的 360 单目深度估计

本篇论文提出了一种名为 OmniFusion 的 360 单目深度估计流程，通过将 360 图像转换为切线图像并采用 CNN 进行分段预测，最后合并分段结果以处理球形畸变问题，并通过几何感知特征融合机制、自注意力变换架构和迭代深度细化机制处理分段预测不一致问题，成功的在多个 360 单目深度估计基准数据集上取得了最先进的性能。

Mar, 2022

使用无监督三眼假设学习单目深度估计

该论文提出了一种可以使用无标注数据进行训练的，基于三目摄像机的深度估计方法，其在 KITTI 数据集上取得了比其他基于双目摄像机以及其他线索的方法更好的性能。

Aug, 2018

基于层次特征引导扩散的无监督单目深度估计

利用生成网络的训练策略，我们提出了一种在无监督单目深度估计中具有鲁棒性的扩散模型，并采用分层特征引导的去噪模块来丰富模型的学习能力，进一步探索了图像重投影中的隐式深度，并设计了一种隐式深度一致性损失，从而提高了模型的性能和深度在视频序列中的尺度一致性。实验证明，我们的方法在生成网络模型中脱颖而出，并且具有显著的鲁棒性。

Jun, 2024