缓解图像剪切中透视扭曲引起的形状模糊

Dec, 2023

缓解图像剪切中透视扭曲引起的形状模糊

Mitigating Perspective Distortion-induced Shape Ambiguity in Image Crops

Aditya Prakash, Arjun Gupta, Saurabh Gupta

TL;DR通过引入信息，模型可以从单幅图像中预测物体的三维形状，并且在三个不同的基准测试数据集中展示了模型的优势。

Abstract

Objects undergo varying amounts of perspective distortion as they move across a camera's field of view. Models for predicting 3D from a single image often work with crops around the object of interest and ignore

发现论文，激发创造

地理监督的视觉深度预测

利用来自惯性测量的全局方向和对场景内对象形状的偏差，来指导视觉三维重建，通过将得出的先验应用于单张图片深度预测的实验，发现某些类别的物体表面法向量可能趋向于与重力对齐或者垂直于重力，添加此先验在基准方法的基础上可以获得超过现有技术的改进，这展示了重力作为一种监督信号的强大效用。

Jul, 2018

野外单幅图像三维模型检索的位置场描述符

提出了基于位置场描述符的单张图像三维模型检索方法，利用位置场来实现从2D像素到3D表面坐标的对应，从而明确地捕捉3D形状和位姿信息，前期融合3D模型和RGB图像的核心瓶颈位置场预测能够规范化数据，拟合更多的虚拟数据，提高模型鲁棒性，最终在多项3D检索指标上以高达20%的绝对值优势显著超越现有技术。

Aug, 2019

PCLs: 基于几何感知的3D姿态透视裁剪层神经重建

该研究提出透视裁剪层（PCL），通过考虑相机几何信息从而去除位置相关的透视效果，成功提升 3D 姿态重建的准确率

Nov, 2020

通过学习局部和全局形状先验层次来促进单视图3D重建的泛化

该文利用不同层次的位置先验信息从输入的深度图中提取详细的局部信息并进行组合，从而改进了新颖形状的泛化能力，具有更好的泛化性能。

Apr, 2021

自监督单目深度估计的细粒度语义感知表示增强

本文提出了在无监督单目深度估计中引入跨域语义信息以提高几何表示的新思路，包括度量学习方法和特征融合模块，并在KITTI数据集上全面评估，在弱质地区和物体边界的监督限制下，本文提出的方法优于现有技术。

Aug, 2021

基于注意力机制的深度蒸馏技术与三维感知位置编码在单目三维物体检测中的应用

提出了一种名为ADD的基于注意力的深度知识蒸馏框架，采用3D感知的位置编码方式，以在KITTI 3D目标检测基准测试上实现单目3D目标检测的最先进性能。

Nov, 2022

MonoEdge：使用局部视角的单目三维物体检测

本论文提出了一种新颖的单目三维目标检测方法，通过利用每个物体的局部透视效果实现。通过在现有的单目3D目标检测框架中插入局部透视模块，我们将局部透视畸变与全局透视效应相结合，展示了在多个数据集上对强基线方法的有效性和优越性。

Jan, 2023

透视感知卷积在单目三维物体检测中的应用

通过结合透视感知卷积层提取更精确和具有上下文意识的特征，将场景线索建模为准确的深度推断，从而提高单目3D目标检测性能。

Aug, 2023

了解邻居：通过空间视觉-语言推理提升单视图重建

通过综合语义和空间上下文推断每个点的密度，我们的KYN方法改进了三维形状恢复并在场景和物体重建方面取得了最先进的结果。

Apr, 2024

分而治之：利用2D语义深度先验和输入依赖查询改善多摄像头3D感知

本研究针对多摄像头图像中的3D感知任务，如3D物体检测和鸟瞰视图分割，提出了一种新的输入感知Transformer框架（SDTR），有效整合了语义和深度信息。研究结果表明，该方法在3D物体检测和BEV分割任务上均表现出最先进的性能，显著减少了分类和位置估计错误。

Aug, 2024