geometry plays a significant role in monocular 3d object detection. It can be
used to estimate object depth by using the perspective projection between
object's physical size and 2D projection in the image plane,
我们提出了一种联合 3D 姿态和焦距估计方法,采用深度学习技术和几何算法,通过将焦距明确地估计和整合到 3D 姿态估计中来实现对野外物体类别的姿态和焦距估计,并在 Pix3D、Comp 和 Stanford 三个具有不同物体类别的具有挑战性的真实世界数据集上进行了详细的评估,结果在多个指标上明显优于现有方法。