CVPRFeb, 2024

TAMM:三适配器多模态学习用于 3D 形状理解

TL;DR通过 TriAdapter Multi-Modal Learning(TAMM),在多模态预训练中引入了三个协同适配器,以更有效地利用 2D 图像和语言模态,缩小 3D 形状数据集的规模限制,提高对 3D 形状的理解和表示学习。