Mar, 2024

LLaVA-Gemma:利用紧凑的语言模型加速多模基础模型

TL;DR我们使用近期发布的 Gemma 系列大型语言模型(LLMs)在流行的 LLaVA 框架中训练了一套多模态基础模型(MMFM)。我们测试了删除三个设计特征对模型性能的影响,并对性能进行了深入分析。最终的 LLaVA-Gemma 模型在多项评估中表现适中,但未能超越当前规模相当的 SOTA 模型。