ICCVSep, 2021

StereOBJ-1M:6D 物体位姿估计的大规模立体图像数据集

TL;DR我们介绍了一个大规模立体 RGB 图像物体姿态估计数据集 StereOBJ-1M,为了解决透明、半透明、反射等复杂场景下的姿态估计问题,并通过一种新颖的多视图注释方法有效地收集了足够规模的数据。该数据集包含超过 393K 帧、超过 1.5M 注释的 18 个物体的全标注 6D 姿态,并在 11 个不同环境中记录的 182 个场景中展示。我们将两种最先进的姿态估计框架作为基线,提出了一种新颖的基于关键点预测的物体级姿态优化方法。