Jun, 2023

利用 RGB 图像进行少样本泛化学习,估计 6DoF 位姿

TL;DR本研究提出一种名为 Cas6D 的级联框架,该框架对六自由度物体姿态进行少样本学习的估计,使用自监督预训练 ViT 积累鲁棒特征、用特征金字塔进一步精炼姿态和借助离散化姿态搜索范围和渐进式缩小姿态搜索范围的特性克服了 6DoF 姿态估计中的一些常见失败模式。该研究表明,相较于 OnePose ++ 和 Gen6D,在 32-shot 设定下,Cas6D 在 LINEMOD 和 GenMOP 数据集上的定位精度分别提高了 9.2%和 3.8%(Proj-5)。