Jan, 2024
UniM-OV3D:使用细粒度特征表示的单模态开放词汇三维场景理解
UniM-OV3D: Uni-Modality Open-Vocabulary 3D Scene Understanding with
Fine-Grained Feature Representation
TL;DR本文提出了一种统一的多模态三维开放词汇场景理解网络(UniM-OV3D),通过对齐点云、图像、语言和深度信息,设计了一个分层点云特征提取模块并使用了层次化三维标题对来提高粗到细点云语义表示学习,实验结果表明我们的方法在室内外基准测试中实现了开放式语义和实例分割的最先进性能。