Nov, 2022

OpenScene: 利用开放式词汇的3D场景理解

TL;DR使用OpenScene和zero-shot方法,借助于CLIP特征空间将3D场景中的点嵌入到文本和图像像素中,以达到不确定性的训练和开放词汇量的查询场景的目的。