CVPRDec, 2021

FLAVA:一种基础语言和视觉对齐模型

TL;DR本篇研究提出了一种名为 FLAVA 的综合视觉与语言基础模型,通过使用单一的综合的通用模型,同时针对视觉和语言任务以及跨模态任务,展现出出色的性能表现。