Jun, 2023

CAD-Estate: RGB 视频中的大规模 CAD 模型标注

TL;DR提出了一种半自动的方法来注释复杂多物体场景的视频,该方法使用来自数据库的 CAD 模型对每个物体进行注释,并使用 9-DoF 姿态变换将其放置在场景的 3D 坐标系中,从而构建了一个大规模的数据集 CAD-Estate,并用它进行了 Mask2CAD 预训练。