Jun, 2024

鹦鹉:多语言视觉指令调整

TL;DRParrot 是一种新方法,利用文本指导在语言级别驱动视觉令牌对齐,以增强多语言大型语言模型的多模态能力,并提供了一个大规模多语言多模态基准测试数据集(MMMB)。