从大到小:多尺度局部平面引导单目深度估计
该研究提出了一种新的深度估计结构和训练策略,使用层次变压器编码器来捕获全局上下文,并设计轻量级但强大的解码器来生成估计的深度图,通过构建连接不同尺度的局部特征和全局解码流之间的连接路径,在分层特征融合模块的作用下,网络可以综合两种表示形式并恢复细节信息。与以往的解码器相比,本文提出的解码器具有更好的性能和更少的计算复杂度,并利用深度估计中的重要观察来改善深度特定的数据增强方法,网络在深度数据集 NYU Depth V2 上达到了最先进的性能,并表现出比其他模型更好的泛化能力和鲁棒性。
Jan, 2022
本文提出了一种新的方法,利用两个深度网络堆栈来解决单张图像深度估计的问题,并应用尺度不变误差来测量深度关系,通过利用原始数据集作为大量训练数据,方法在 NYU Depth 和 KITTI 上实现了最先进的结果。
Jun, 2014
使用神经网络对本地场景几何结构进行建模,通过对不同阶、方向和比例下的深度导数进行概率分布预测,采用全球化处理方法获得一个一致性深度图以解决深度估计中的歧义。
May, 2016
提出了一种基于像素平面性先验的单目深度估计方法,并使用具有两个输出头的卷积神经网络来学习并由此实现端到端的训练,以预测尖锐边缘和具有合理 3D 重建的深度图,将其在 NYU Depth-v2 和 KITTI 的 Garg 数据集上的实验结果击败了以前的方法并创造了最新的技术成果。
Apr, 2022
本文提出了两种优化现有方法的方法:一种是通过网络结构融合不同尺度提取的特征,另一种是通过多种损失函数来测量训练中的推理错误。实验结果表明,这两种改进使得深度估计的精度显著提高,使得对小物体和物体边界的更细分辨率重建成为可能。
Mar, 2018
该论文提出了一种卷积神经网络模型,由密集特征提取器(DFE)和深度图生成器(DMG)组成,利用注意力机制融合 DFE 产生的多尺度特征,可以快速且准确地预测深度图,同时在结构细节方面保持了更好的性能表现。
Sep, 2018
通过对输入分辨率和场景结构对深度估计性能的影响进行分析,本文提出了一种使用深度合并网络,结合低分辨率和高分辨率估计的方法,以在一定精度下生成具有细节的高分辨率深度图像,其中包括双重估计方法和补丁选择方法。通过合并不同分辨率的估计并应用不同的上下文,本文在预训练模型的基础上生成了多兆像素的深度图像。
May, 2021
本文提出了一种基于卷积神经网络的深度估计方法,结合迁移学习使用高性能网络初始化编码器以及增强和训练策略以获得更准确的结果,结果表明,即使是非常简单的解码器,我们的方法也能够产生细节详尽的高分辨率深度图像。
Dec, 2018
采用间距增加离散化(SID)策略将深度网络学习重新构建为顺序回归问题,采用累积回归损失训练网络,同时采用多尺度网络结构,避免不必要空间池化,并能够平行捕捉多尺度信息,该方法在四个挑战性基准测试中实现了最先进的结果,并赢得了 Robust Vision Challenge 2018 年的冠军。
Jun, 2018