Mar, 2022

WuDaoMM:大规模多模态数据集用于预训练模型

TL;DR本篇论文介绍了一种大规模多模态库 WuDaoMM 用于 Vision-Language 解决方案的预训练模型,其中包含了超过 650M 的弱相关和强相关的图片 - 文本对,并经过实验证明,WuDaoMM 是一种高效的 VLPMs 数据集。