Feb, 2025

高效整合大型语言模型与视觉感知:从训练范式的角度进行调查

TL;DR本研究针对多模态学习中视觉与语言模式整合的研究空白,特别是大型语言模型(LLMs)与视觉模式结合的发展。通过分类和审查34种视觉大型语言模型(VLLMs),论文提供了关于训练范式演变和参数效率的独特见解,强调了在有效整合视觉模态方面的新方法和实用性,从而对研究人员和实践者具有重要指导价值。