Mar, 2024

构建多语言视觉文本数据集揭示视觉语言模型的多语言能力

TL;DR我们通过模板构建了四种语言的多语言视觉文本数据集,介绍了九项视觉语言任务,并引入了解释机制以评估大型语言模型在视觉语言任务上的表现。