BriefGPT.xyz
Ask
alpha
关键词
open-source large multimodal models
搜索结果 - 1
一个关于扩展面向指令调整的大型多模态模型的实证研究
通过调整视觉指导,对开源大型多模态模型进行扩展研究,探索影响多模态和语言能力的变量,发现扩展模型能够提升性能,具有与整个模型微调相当的效果,并强调了提高图像分辨率和混合多模态语言数据对性能的重要性,有时视觉指导可以提高纯语言功能。
PDF
10 months ago
Prev
Next