ACLJun, 2021

GEM: 多模态任务通用评估基准

TL;DR本文介绍了一个新的多模态任务的通用评估基准 GEM,它是一个大规模的视觉 - 语言基准,由包括图像 - 语言任务和视频 - 语言任务的 GEM-I 和 GEM-V 组成,并标记有多种语言的数据集。我们还为此基准提供了两个基准模型,旨在推动多语言多模态研究的发展。