Jun, 2024

走向人类级别的三维相对姿态估计:通用化、免训练、单个参考

TL;DR用 RGB-D 参考图像的 2.5D 形状、现成可微分渲染器以及 DINOv2 预训练模型提取的语义线索为基础,无需标记和训练,提出了一种新颖的可推广的三维相对姿态估计方法,通过渲染与对比新的 RGB 和语义地图,实现了只需单个 RGB-D 参考图像可用于未见过的对象的姿态估计。