May, 2024

MiniGPT-3D:利用2D先验信息高效对齐大型语言模型中的3D点云

TL;DRMiniGPT-3D是一种高效而强大的3D-LLM,仅经过27小时在一台RTX 3090上训练,在2D-LLMs的2D先验知识的帮助下,使用四阶段训练策略进行模态对齐,并采用高效聚合特征的混合查询专家模块,以及低参数的微调方法LoRA和Norm微调,在3D对象分类和字幕任务上实现了具有显著较低训练成本的SOTA结果。