自监督单目深度估计的细粒度语义感知表示增强
本文研究自监督学习中如何直接运用语义结构来指导几何表示的学习,提出了一种新的基于预训练语义分割网络和像素自适应卷积的架构,并使用两阶段训练过程来克服动态对象上的常见语义偏差。结果表明该方法在所有像素、细节和语义类别上都优于现有方法,实现了自监督单目深度预测的最新水平。
Feb, 2020
提出了一种半监督语义分割的框架,采用自监督单目深度估计和利用场景几何形状强数据扩增的方式,结合深度特征差异和难度级别,通过学生 - 教师框架选择最有用的样本进行语义分割的注释,实现了在 Cityscapes 数据集上半监督语义分割的最好结果。
Dec, 2020
通过利用语义标记的图像和通过图像变形获得的无监督信号来联合学习语义分割和深度估计,提出了一种半监督的深度估计方法,结果表明在 KITTI 数据集上超过了单目深度估计的先进方法。
Oct, 2018
本文提出了一种基于 HRNet 网络的深度估计网络 ——DIFFNet,它能在下采样和上采样过程中利用语义信息,并通过特征融合和注意力机制提高算法表现,实验结果表明,该方法在 KITTI 基准数据集上优于当前最先进的单目深度估计方法,并具有处理更高分辨率数据的潜力。我们还通过建立具有挑战性案例的测试集提出了额外的评估策略。
Oct, 2021
该论文提出了一种自监督学习的方法,利用几何先验和自编码器来提高单目深度估计的效果,实验结果表明该方法在 KITTI 数据集上的表现优于现有方法,适用于高性能 GPU 和嵌入式设备。
Aug, 2019
该论文提出了一种改进的自监督学习方法,包括最小 reprojection 损失、全分辨率多尺度采样和自动屏蔽损失,以实现单眼深度估计。研究结果表明,该方法能够在 KITTI 基准测试上达到业界领先的结果。
Jun, 2018
本文提出了一种半监督和领域自适应的语义分割框架,它利用自监督单目深度估计(SDE)来增强。该框架采用 SDE 作为辅助任务,通过选择最有用的样本、实现数据增强、转移 SDE 学习到的特征以及利用 Cross-Domain DepthMix 和 Match Geometry Sampling 来利用额外的标记合成数据与真实数据对齐,同时在 Cityscapes 数据集上进行了验证,并获得了半监督语义分割和半监督领域适应的最先进结果。
Aug, 2021
本文提出了一种自主引导的语义深度估计方法(SGDepth),通过交叉域训练避免移动车辆和行人等动态类别对象对深度标签的干扰,利用异构网络头进行语义分割和深度估计,采用语义遮罩机制预防动态物体的污染,并引入一种检测算法学习移动类别对象的深度。通过在多个数据集上评估验证了该方法的性能。
Jul, 2020
本研究提出一种方法,利用单眼光度一致性为唯一的监督,联合训练深度、自我运动估计和物体相对于场景的稠密三维平移场的估计,通过已知 3D 平移场的稀疏性和对于刚性移动物体的恒定性进行正则化,有效提高了单眼深度预测模型的准确性。
Oct, 2020