Aug, 2023

MV-ROPE: 面向鲁棒的类别级物体姿态和尺寸估计的多视角约束

TL;DR提出了一种新颖的基于 RGB 图像的类别级 6D 物体姿态和尺寸估计框架,通过预测归一化物体坐标空间 (NOSC) 来提取 RGB 图像中的物体规范表示。通过利用多视图信息和单目密集 SLAM 框架,引入多视图约束,可以从单目图像中获取准确的相机姿态和深度估计。此外,通过引入相机相对姿态的约束,可以在多视图物体姿态上应用修剪策略和鲁棒姿态平均,从而在缺乏直接深度读数的情况下获得更准确、更鲁棒的类别级物体姿态估计。此外,还引入了一种新颖的 NOSC 预测网络,显著提高了性能。实验证明了我们提出方法的强大性能,甚至可以与公共数据集序列上的最先进的 RGB-D 方法相媲美。此外,通过在自收集数据集上评估,展示了我们方法的泛化能力。