CVPRMar, 2019

基于 CNN 的绝对相机姿态回归的局限性理解

TL;DR本研究旨在解决场景中精确的相机姿态估计的视觉定位问题,传统方法使用 3D 几何学,而新近出现的卷积神经网络则直接从输入图像中学习相机姿态,但是并未达到 3D 方法的精度。本论文提出了一种理论模型来预测 pose regression 技术的失败案例,并证实了我们的预测。作者进一步表明,pose regression 与图像检索非常相似,而不是与 3D 结构的准确姿态估计。最重要的是,当前方法并不能持续超越手工图像检索基线,因此需要进一步的研究。