Dec, 2023

Uni3DL: 三维和语言理解的统一模型

TL;DRUni3DL 是一个统一的 3D 和语言理解模型,它运用于点云而不是传统的多视图图像,实现了对多种 3D 任务的支持,包括语义分割、目标检测、实例分割、视觉定位、3D 字幕和文本 - 3D 跨模态检索,并且在性能上超过了最先进的特定任务模型。