Dec, 2023

Omni-SMoLA:用软混合低秩专家提升通用多模态模型

TL;DR使用 Omni-SMoLA 结构及 Soft MoE 方法,在大规模多模态模型上实现了性能提升,广泛应用于生成式视觉与语言任务中,达到最新的至顶性能水平。