Dec, 2023

Uni3DL: 三维和语言理解的统一模型

TL;DRUni3DL是一个统一的3D和语言理解模型,它运用于点云而不是传统的多视图图像,实现了对多种3D任务的支持,包括语义分割、目标检测、实例分割、视觉定位、3D字幕和文本-3D跨模态检索,并且在性能上超过了最先进的特定任务模型。