自监督单目深度估计的细粒度语义感知表示增强

ICCVAug, 2021

自监督单目深度估计的细粒度语义感知表示增强

Fine-grained Semantics-aware Representation Enhancement for Self-supervised Monocular Depth Estimation

Hyunyoung Jung, Eunhyeok Park, Sungjoo Yoo

TL;DR本文提出了在无监督单目深度估计中引入跨域语义信息以提高几何表示的新思路，包括度量学习方法和特征融合模块，并在 KITTI 数据集上全面评估，在弱质地区和物体边界的监督限制下，本文提出的方法优于现有技术。

Abstract

self-supervised monocular depth estimation has been widely studied, owing to its practical importance and recent promising improvements. However, most works suffer from limited supervision of photometric consistency

self-supervised monocular depth estimation photometric consistency cross-domain information geometric representation enhancement semantic knowledge

发现论文，激发创造

自监督单目深度的语义引导表示学习

本文研究自监督学习中如何直接运用语义结构来指导几何表示的学习，提出了一种新的基于预训练语义分割网络和像素自适应卷积的架构，并使用两阶段训练过程来克服动态对象上的常见语义偏差。结果表明该方法在所有像素、细节和语义类别上都优于现有方法，实现了自监督单目深度预测的最新水平。

Feb, 2020

利用自监督深度估计提高语义分割的三种方法

提出了一种半监督语义分割的框架，采用自监督单目深度估计和利用场景几何形状强数据扩增的方式，结合深度特征差异和难度级别，通过学生 - 教师框架选择最有用的样本进行语义分割的注释，实现了在 Cityscapes 数据集上半监督语义分割的最好结果。

Dec, 2020

几何与语义相遇：半监督单目深度估计

通过利用语义标记的图像和通过图像变形获得的无监督信号来联合学习语义分割和深度估计，提出了一种半监督的深度估计方法，结果表明在 KITTI 数据集上超过了单目深度估计的先进方法。

Oct, 2018

使用内部特征融合的自监督单目深度估计

本文提出了一种基于 HRNet 网络的深度估计网络 ——DIFFNet，它能在下采样和上采样过程中利用语义信息，并通过特征融合和注意力机制提高算法表现，实验结果表明，该方法在 KITTI 基准数据集上优于当前最先进的单目深度估计方法，并具有处理更高分辨率数据的潜力。我们还通过建立具有挑战性案例的测试集提出了额外的评估策略。

Oct, 2021

利用传统视觉里程计增强自监督单目深度估计

该论文提出了一种自监督学习的方法，利用几何先验和自编码器来提高单目深度估计的效果，实验结果表明该方法在 KITTI 数据集上的表现优于现有方法，适用于高性能 GPU 和嵌入式设备。

Aug, 2019

自监督单目深度估计探究

该论文提出了一种改进的自监督学习方法，包括最小 reprojection 损失、全分辨率多尺度采样和自动屏蔽损失，以实现单眼深度估计。研究结果表明，该方法能够在 KITTI 基准测试上达到业界领先的结果。

Jun, 2018

借助自监督深度估计改进半监督和领域自适应语义分割

本文提出了一种半监督和领域自适应的语义分割框架，它利用自监督单目深度估计（SDE）来增强。该框架采用 SDE 作为辅助任务，通过选择最有用的样本、实现数据增强、转移 SDE 学习到的特征以及利用 Cross-Domain DepthMix 和 Match Geometry Sampling 来利用额外的标记合成数据与真实数据对齐，同时在 Cityscapes 数据集上进行了验证，并获得了半监督语义分割和半监督领域适应的最先进结果。

Aug, 2021

自监督单目深度估计：通过语义引导解决动态物体问题

本文提出了一种自主引导的语义深度估计方法（SGDepth），通过交叉域训练避免移动车辆和行人等动态类别对象对深度标签的干扰，利用异构网络头进行语义分割和深度估计，采用语义遮罩机制预防动态物体的污染，并引入一种检测算法学习移动类别对象的深度。通过在多个数据集上评估验证了该方法的性能。

Jul, 2020

将自监督单目深度引入无监督域自适应中进行语义分割

通过利用自监督单目深度估计技术提高无监督域自适应方法的语义分割性能并达到最先进的自动驾驶水平。

Oct, 2021

动态场景下的无监督单目深度学习

本研究提出一种方法，利用单眼光度一致性为唯一的监督，联合训练深度、自我运动估计和物体相对于场景的稠密三维平移场的估计，通过已知 3D 平移场的稀疏性和对于刚性移动物体的恒定性进行正则化，有效提高了单眼深度预测模型的准确性。

Oct, 2020