CVPRFeb, 2023

Mask3D:通过学习掩码的 3D 先验知识预训练 2D 视觉 Transformer

TL;DR提出了一种名为 Mask3D 的预训练方法,可以将现有的大规模 RGB-D 数据应用于自监督预训练中,将 3D 先验嵌入到 2D 的学习特征中,并对多个场景理解任务产生了改进,尤其是语义分割。