Feb, 2024

通过聚类学习像素级连续深度表示以用于深度完整

TL;DR深度完整性的一个长期挑战是计算机视觉领域中的一个难题。近年来,基于分类的方法取得了巨大的进展。然而,大多数现有的基于分类的方法依赖于预定义的像素共享和离散深度值作为深度类别。本文从聚类的角度重新思考深度完整性,并提出了一种名为CluDe的新型基于聚类的框架,它专注于学习像素级和连续深度表示。CluDe的关键思想是利用像素值的聚类来学习一组深度中心作为深度表示。然后,CluDe对这些深度中心估计偏移量,使其可以在深度分布的深度轴上进行动态调整,从而生成像素级和连续深度表示。广泛的实验表明,CluDe成功地利用像素级和连续深度表示降低了对象边界处的深度模糊。此外,CluDe在VOID数据集上实现了最先进的性能,并在KITTI数据集上超过了基于分类的方法。