视频非监督单目深度的持续学习
本研究提出了一种利用单目和立体相机视频中的连续帧进行深度估计的自监督联合学习框架,其中使用了隐式深度线索提取器来利用动态和静态线索产生有用的深度建议,并通过引入高维注意力模块来提取清晰的全局变换。实验证明,所提出的框架在 KITTI 和 Make3D 数据集上优于现有技术。
Jun, 2020
本文介绍了一种基于 ConvLSTM 和三种不同类型深度预测网络的自监督实时单目深度估计和完成方法,能够产生一系列的深度图,该方法灵活且可与不同类型稀疏深度图案件组合使用,实验表明,我们的方法在自监督场景中始终优于其基于图像的对应方法,并且在三个流行组的深度预测方法中也表现出更好的性能。
Jan, 2020
该论文提出了一种无监督学习框架,通过使用逐步的递归调整和融合编码器和解码器特征来提高单张图像的深度推断,并使用多组滤波器用于残差上采样来学习保持边缘的滤波,使用基于自运动恢复的网络来估计移动对象的移动场,并进一步通过采用鲁棒训练损失对模型中参数的使用进行优化,该模型结构只使用单张图像在测试时间中,模型参数仅有 2.97 百万个,但却在 KITTI 和 Cityscapes 基准测试中实现了最先进的结果。
Mar, 2023
本研究提出一种方法,利用单眼光度一致性为唯一的监督,联合训练深度、自我运动估计和物体相对于场景的稠密三维平移场的估计,通过已知 3D 平移场的稀疏性和对于刚性移动物体的恒定性进行正则化,有效提高了单眼深度预测模型的准确性。
Oct, 2020
该论文提出了一种自监督学习的方法,利用几何先验和自编码器来提高单目深度估计的效果,实验结果表明该方法在 KITTI 数据集上的表现优于现有方法,适用于高性能 GPU 和嵌入式设备。
Aug, 2019
提出 ManyDepth,一种自适应的、可以在测试时间利用序列信息的深度估计方法,通过深度自监督训练基于端到端代价体系积攒的方法,鼓励网络忽略不可靠的代价体以及针对静态相机场景的增强方案。实验证明此方法在 KITTI 和 Cityscapes 上表现优于其他单帧和多帧的自监督基线模型。
Apr, 2021
本文介绍了一种新方法,可将任何现成的自我监督的单目深度重建系统扩展到在测试时使用多个图像。该方法利用自我监督来提高多个视图可用时深度重建的准确性,在 KITTI 基准测试中,我们的自我监督方法在常见的三种设置(单目、立体和单目 + 立体)下平均减少绝对误差 25%,并在准确性上接近完全受监督的最先进方法。
Apr, 2020