Mar, 2024
LLaVA-Gemma:利用紧凑的语言模型加速多模基础模型
LLaVA-Gemma: Accelerating Multimodal Foundation Models with a Compact
Language Model
TL;DR我们使用近期发布的Gemma系列大型语言模型(LLMs)在流行的LLaVA框架中训练了一套多模态基础模型(MMFM)。我们测试了删除三个设计特征对模型性能的影响,并对性能进行了深入分析。最终的LLaVA-Gemma模型在多项评估中表现适中,但未能超越当前规模相当的SOTA模型。