使用自注意力和离散视差体进行自监督单目训练深度估计
该论文提出了一种改进的自监督学习方法,包括最小 reprojection 损失、全分辨率多尺度采样和自动屏蔽损失,以实现单眼深度估计。研究结果表明,该方法能够在 KITTI 基准测试上达到业界领先的结果。
Jun, 2018
本篇论文提出了一种基于子像素卷积层和翻转增强层的高分辨率自监督单目深度估计方法,在公共 KITTI 基准测试中取得了目前最好表现。
Oct, 2018
本文介绍了一种新方法,可将任何现成的自我监督的单目深度重建系统扩展到在测试时使用多个图像。该方法利用自我监督来提高多个视图可用时深度重建的准确性,在 KITTI 基准测试中,我们的自我监督方法在常见的三种设置(单目、立体和单目 + 立体)下平均减少绝对误差 25%,并在准确性上接近完全受监督的最先进方法。
Apr, 2020
该论文提出了一种自监督学习的方法,利用几何先验和自编码器来提高单目深度估计的效果,实验结果表明该方法在 KITTI 数据集上的表现优于现有方法,适用于高性能 GPU 和嵌入式设备。
Aug, 2019
提出 ManyDepth,一种自适应的、可以在测试时间利用序列信息的深度估计方法,通过深度自监督训练基于端到端代价体系积攒的方法,鼓励网络忽略不可靠的代价体以及针对静态相机场景的增强方案。实验证明此方法在 KITTI 和 Cityscapes 上表现优于其他单帧和多帧的自监督基线模型。
Apr, 2021
自监督的单目深度估计任务中,离散视差预测已被证明比常规连续方法获得更高质量深度图。然而,当前的离散化策略通常以手工制定且刚性的方式将场景的深度范围划分为箱子,限制了模型的性能。本文提出了一种可学习模块,自适应离散视差体积(ADDV),能够动态感知不同 RGB 图像中的深度分布,并为其生成自适应箱子。该模块可以集成到现有的 CNN 架构中,使网络能够为箱子生成代表性数值和其概率分布。此外,我们引入了新的训练策略 - 均一化和锐化 - 通过损失项和温度参数,以在自监督条件下提供规范化,防止模型退化或崩溃。实证结果表明,ADDV 能有效处理全局信息,在各种场景中生成适当的箱子,并与手工方法相比产生更高质量的深度图。
Apr, 2024
该研究针对单目深度估计的自监督学习方法,在不需要昂贵激光扫描或其他基础数据的情况下,使用 Depth Hints 通过加入来自简单立体算法的参考感知补充了光度学重投影代价函数,从而提高训练深度估计网络时的深度预测精度,该方法取得了在 KITTI 数据集上的最优预测效果。
Sep, 2019
本研究提出了一种利用单目和立体相机视频中的连续帧进行深度估计的自监督联合学习框架,其中使用了隐式深度线索提取器来利用动态和静态线索产生有用的深度建议,并通过引入高维注意力模块来提取清晰的全局变换。实验证明,所提出的框架在 KITTI 和 Make3D 数据集上优于现有技术。
Jun, 2020