缓解图像剪切中透视扭曲引起的形状模糊
利用来自惯性测量的全局方向和对场景内对象形状的偏差,来指导视觉三维重建,通过将得出的先验应用于单张图片深度预测的实验,发现某些类别的物体表面法向量可能趋向于与重力对齐或者垂直于重力,添加此先验在基准方法的基础上可以获得超过现有技术的改进,这展示了重力作为一种监督信号的强大效用。
Jul, 2018
提出了基于位置场描述符的单张图像三维模型检索方法,利用位置场来实现从2D像素到3D表面坐标的对应,从而明确地捕捉3D形状和位姿信息,前期融合3D模型和RGB图像的核心瓶颈位置场预测能够规范化数据,拟合更多的虚拟数据,提高模型鲁棒性,最终在多项3D检索指标上以高达20%的绝对值优势显著超越现有技术。
Aug, 2019
该文利用不同层次的位置先验信息从输入的深度图中提取详细的局部信息并进行组合,从而改进了新颖形状的泛化能力,具有更好的泛化性能。
Apr, 2021
本文提出了在无监督单目深度估计中引入跨域语义信息以提高几何表示的新思路,包括度量学习方法和特征融合模块,并在KITTI数据集上全面评估,在弱质地区和物体边界的监督限制下,本文提出的方法优于现有技术。
Aug, 2021
提出了一种名为ADD的基于注意力的深度知识蒸馏框架,采用3D感知的位置编码方式,以在KITTI 3D目标检测基准测试上实现单目3D目标检测的最先进性能。
Nov, 2022
本论文提出了一种新颖的单目三维目标检测方法,通过利用每个物体的局部透视效果实现。通过在现有的单目3D目标检测框架中插入局部透视模块,我们将局部透视畸变与全局透视效应相结合,展示了在多个数据集上对强基线方法的有效性和优越性。
Jan, 2023
本研究针对多摄像头图像中的3D感知任务,如3D物体检测和鸟瞰视图分割,提出了一种新的输入感知Transformer框架(SDTR),有效整合了语义和深度信息。研究结果表明,该方法在3D物体检测和BEV分割任务上均表现出最先进的性能,显著减少了分类和位置估计错误。
Aug, 2024