May, 2024

Ovis: 多模型大型语言模型的结构嵌入对齐

TL;DR通过结构对齐视觉和文本嵌入,提出了一种名为 Ovis 的新的多模态大型语言模型体系结构,以捕捉图像的丰富语义,并在各种多模态基准测试中表现出优越性能,从而推动了多模态学习的更有效进展。