May, 2024

多语种多样性增强视觉 - 语言表示

TL;DR使用多语言数据集进行预训练可以提高在多个视觉任务中的性能,包括对非英语数据的使用,以及增加地理多样性任务中非洲地区的表现。