Apr, 2024

MoVA: 将多模态背景下的视觉专家混合进行调整

TL;DR通过将任务特定视觉专家与粗到细的机制自适应地路由和融合,MoVA 可在各种具有挑战性的多模态基准测试中显著提高性能。