Aug, 2023

MM-Vet:评估大型多模态集成模型的能力

TL;DR我们提出了一个评估基准MM-Vet,它检查了复杂的多模态任务上的大型多模态模型(LMMs)。我们根据洞察力设计了MM-Vet,该洞察力表明解决复杂任务的有趣能力通常是通过一种通用模型能够整合不同的核心视觉语言(VL)能力实现的。