Dec, 2020

UNIMO:通过跨模态对比学习实现统一模态理解和生成

TL;DR本文介绍了一种名为UNIMO的统一单模态预训练架构,它可以有效地适应单模态和多模态理解和生成任务,利用大规模自由文本语料库和图像集合来提高视觉和文本理解的能力,并使用跨模态对比学习来将文本和视觉信息对齐到图像 - 文本对的统一语义空间。实验结果表明,UNIMO显著改善了几个单模态和多模态下游任务的性能。