BriefGPT.xyz
大模型
Ask
alpha
关键词
multi-modal agi
搜索结果 - 1
InternVL:扩展视觉基础模型并对通用视觉语言任务进行对齐
通过设计大规模的视觉语言基础模型 (InternVL),其参数规模扩展到 60 亿,并逐步与大型语言模型对齐,该研究旨在推动视觉与视觉语言基础模型的发展与应用,以实现视觉感知任务的最新性能、多模式对话系统的构建和与大型语言模型的链接。
PDF
6 months ago
Prev
Next