BriefGPT.xyz
大模型
Ask
alpha
关键词
vila
搜索结果 - 1
VILA:关于视觉语言模型的预训练
通过逐步可控的比较,我们研究了增强大语言模型 (LLM) 向视觉语言模型 (VLM) 扩展的 VLM 预训练过程的设计选择。我们通过增强的预训练方法构建了 VILA,一系列视觉语言模型,无需额外的修饰即可在主要基准测试中始终优于当前最先进的
→
PDF
7 months ago
Prev
Next