使用小波分解进行单张图像深度预测
本文提出了一种基于卷积神经网络的深度估计方法,结合迁移学习使用高性能网络初始化编码器以及增强和训练策略以获得更准确的结果,结果表明,即使是非常简单的解码器,我们的方法也能够产生细节详尽的高分辨率深度图像。
Dec, 2018
通过引入基于注意力机制的 Skip Attention Module,使得 Monocular Depth Estimation 的编码器和解码器特征更好地融合;并将问题表述为一个像素查询细化问题,利用提出的 Bin Center Predictor 模块进行限制性回归。在 NYUV2 和 KITTI 两个数据集上进行的广泛实验均表明,该架构的性能优于现有技术,并在 SUNRGBD 数据集上具有更好的泛化性能。
Oct, 2022
本文提出了一种基于自编码器的无监督深度卷积神经网络学习框架,通过训练不需要预训练或注释的神经网络,为单视图深度预测提供了一种新的方法。
Mar, 2016
本篇论文提出了一种基于子像素卷积层和翻转增强层的高分辨率自监督单目深度估计方法,在公共 KITTI 基准测试中取得了目前最好表现。
Oct, 2018
该论文提出了一种基于 CNN 编码器 - 解码器结构的 WCNN,并在城市景观数据集上进行了实验,结果表明它能够有效地进行高分辨率密集像素预测并提高准确性。
Aug, 2018
本文提出了一种将实例深度复杂度降低的方法,即将实例深度重新定义为实例表面视觉深度(视觉深度)和实例属性深度(属性深度)的组合,并将 3D 定位不确定性分解为视觉深度不确定性和属性深度不确定性,取得了 KITTI 数据集的最新的最佳结果
Jul, 2022
该研究提出了一种新的深度估计结构和训练策略,使用层次变压器编码器来捕获全局上下文,并设计轻量级但强大的解码器来生成估计的深度图,通过构建连接不同尺度的局部特征和全局解码流之间的连接路径,在分层特征融合模块的作用下,网络可以综合两种表示形式并恢复细节信息。与以往的解码器相比,本文提出的解码器具有更好的性能和更少的计算复杂度,并利用深度估计中的重要观察来改善深度特定的数据增强方法,网络在深度数据集 NYU Depth V2 上达到了最先进的性能,并表现出比其他模型更好的泛化能力和鲁棒性。
Jan, 2022
本文提出了一种新的方法,利用两个深度网络堆栈来解决单张图像深度估计的问题,并应用尺度不变误差来测量深度关系,通过利用原始数据集作为大量训练数据,方法在 NYU Depth 和 KITTI 上实现了最先进的结果。
Jun, 2014
本文论述了如何通过使用 RGB-D 原始数据,采用单个深度回归网络来学习来自稀疏深度范例的密集深度估计,并研究了样本数量对预测准确性的影响,提出的算法有两个应用:转换稀疏地图为密集地图和 LiDAR 的超分辨率。
Sep, 2017
设计了 SmallDepth 方法以平衡精度与速度,通过等效转换模块、金字塔损失和函数逼近损失的引入,提高了 SmallDepth 的效果,实验结果在 KITTI 数据集上达到了最先进水平,并具有 500 帧每秒的推理速度和约 2 M 参数。
May, 2024