Nov, 2022

PointCLIP V2: 适应强大3D开放世界学习的CLIP

TL;DR本文介绍了一种名为PointCLIP V2的3D开放世界学习器,它使用对比语言-图像预训练(CLIP)以及大规模语言模型来在3D点云数据上进行零-shot分类、部分分割和物体检测。PointCLIP V2通过引入现实形状投影模块和自动设计更具描述性的3D-语义暗示,显著超越了PointCLIP的性能。