通过局部深度分布代替全局深度分布并将其引入编码器 - 解码器架构中,以提高从单个图像中估计深度的准确性
Mar, 2022
本文提出了一种适用于基于分类 - 回归的深度估算任务的新框架 BinsFormer,该框架主要关注该任务中的两个关键组件:适应性 bins 的恰当生成和概率分布及 bins 预测之间的足够交互。
Apr, 2022
本文提出了一种基于卷积神经网络的深度估计方法,结合迁移学习使用高性能网络初始化编码器以及增强和训练策略以获得更准确的结果,结果表明,即使是非常简单的解码器,我们的方法也能够产生细节详尽的高分辨率深度图像。
Dec, 2018
通过引入迭代弹性分区的概念,利用以分类 - 回归为基础的方法来搜索高质量的深度,最终的实验证明了该方法在 KITTI、NYU-Depth-v2 和 SUN RGB-D 数据集上超过了之前的最先进技术。
Sep, 2023
本文提出了一种基于深度信息补全技术,使用 RGB 图像和不完整的深度图像进行输入,设计了一种新的两支分支端对端融合网络,其中一个支路使用编码器 - 解码器结构从原始深度图中对局部密集深度值进行回归,另一个分支提出了一种 RGB 深度融合 GAN,通过自适应融合模块和置信度融合头来融合这两个分支的输出,从而实现了对室内环境中丢失深度数据的精确补全。
本文提出一种双向注意力网络(BANet)用于单目深度估计,通过利用神经机器翻译的概念基础和引入双向注意力模块,该方法能够高效地将局部和全局信息相融合,并在 KITTI 和 DIODE 数据集上显著优于传统的前馈模型以及其他现有的单目深度估计方法。
Sep, 2020
基于编码器 - 解码器结构的新型深度补全模型提出了两个关键组件:MagaConv 架构和 BP-Fusion 模块。其中,MagaConv 架构通过使用迭代更新的遮罩调制卷积运算来获取精确的深度特征,而 BP-Fusion 模块通过在全局视角中利用连续的双向融合结构逐步整合深度和颜色特征。通过在包括 NYU-Depth V2,DIML 和 SUN RGB-D 在内的流行基准数据集上进行广泛实验,我们的模型表现优越,成就了在深度图像补全方面的卓越性能,并在准确性和可靠性方面超越了现有方法。
Jan, 2024
通过引入基于注意力机制的 Skip Attention Module,使得 Monocular Depth Estimation 的编码器和解码器特征更好地融合;并将问题表述为一个像素查询细化问题,利用提出的 Bin Center Predictor 模块进行限制性回归。在 NYUV2 和 KITTI 两个数据集上进行的广泛实验均表明,该架构的性能优于现有技术,并在 SUNRGBD 数据集上具有更好的泛化性能。
Oct, 2022
本文提出了一种名为 AdaBin 的自适应二值化方法,它通过使用符号函数难以准确地将全精度值二值化的事实,使得我们获得了一组自适应的最优二进制集合,进一步提高了二值特征的表示能力。实验结果表明,AdaBin 在大量基准模型和数据集上达到了 state-of-the-art 的性能。
Aug, 2022
本文提出了两种优化现有方法的方法:一种是通过网络结构融合不同尺度提取的特征,另一种是通过多种损失函数来测量训练中的推理错误。实验结果表明,这两种改进使得深度估计的精度显著提高,使得对小物体和物体边界的更细分辨率重建成为可能。
Mar, 2018