CVPRNov, 2022

OpenScene: 利用开放式词汇的 3D 场景理解

TL;DR使用 OpenScene 和 zero-shot 方法,借助于 CLIP 特征空间将 3D 场景中的点嵌入到文本和图像像素中,以达到不确定性的训练和开放词汇量的查询场景的目的。