Jan, 2025
CL3DOR:通过高分辨率点云的赔率比进行3D大规模多模态模型的对比学习
CL3DOR: Contrastive Learning for 3D Large Multimodal Models via Odds
Ratio on High-Resolution Point Clouds
TL;DR本研究针对现有训练数据集中视觉和文本内容信息颗粒度不足和清晰度不高的问题,提出了CL3DOR模型,通过增加点云密度和构建信息丰富的困难负样本来提升多模态理解的精准性与清晰度。实验结果表明,CL3DOR在3D场景理解和推理基准测试中达到了最先进的表现,展示了其关键组件的有效性。