CVPRApr, 2022

利用渲染和比较进行焦距和物体姿态估计

TL;DR本文提出了 FocalPose 方法,采用神经网络进行渲染和比较,共同估计单个 RGB 图像中已知对象的相机 - 对象 6D 姿态和相机焦距。通过推导一个焦距更新规则,将现有的 6D 姿态估计器扩展到联合估计任务,研究了几种不同的损失函数,认为将直接焦距回归和重投影损失相结合可以获得更好的结果。在三个具有挑战性的基准数据集上展示了结果,证明了我们的焦距和 6D 姿态估计比现有的最先进方法误差更小。