Feb, 2024

TAMM:三适配器多模态学习用于3D形状理解

TL;DR通过TriAdapter Multi-Modal Learning(TAMM),在多模态预训练中引入了三个协同适配器,以更有效地利用2D图像和语言模态,缩小3D形状数据集的规模限制,提高对3D形状的理解和表示学习。