CVPRApr, 2024

探究视觉基础模型的三维认知能力

TL;DR最近大规模预训练的进步提供了具有强大功能的视觉基础模型。我们分析了视觉基础模型的三维感知能力,并通过一系列实验揭示了当前模型的几个局限性。