Nov, 2022

PointCLIP V2: 适应强大 3D 开放世界学习的 CLIP

TL;DR本文介绍了一种名为 PointCLIP V2 的 3D 开放世界学习器,它使用对比语言 - 图像预训练(CLIP)以及大规模语言模型来在 3D 点云数据上进行零 - shot 分类、部分分割和物体检测。PointCLIP V2 通过引入现实形状投影模块和自动设计更具描述性的 3D - 语义暗示,显著超越了 PointCLIP 的性能。