Oct, 2023

JM3D 和 JM3D-LLM:借助联合多模态提示提升 3D 表示

TL;DR为了解决 3D 数据与 2D 图像和文本的对齐问题带来的信息退化、协同不足和细节利用不充分的挑战,本文介绍了一种综合点云、文本和图像的综合方法 JM3D,其关键贡献是结构化多模态组织器和联合多模态对齐,通过高效的微调将 3D 表示与大型语言模型相结合,JM3D-LLM 在 ModelNet40 和 ScanObjectNN 的评估中表现出优势,进一步证明了我们的表示转换方法的有效性。