MMFeb, 2022

CommerceMM: 基于全检索的大规模商业多模态表示学习

TL;DRCommerceMM 是一种多模态模型,其具备多种理解商业主题的能力,并能够推广到广泛的任务范围,包括多模态分类、图像 - 文本检索、查询 - 产品检索、图像 - 产品检索等。它使用预训练的方式,在图像 - 文本对上完成了 5 个有效的预训练任务,并在 9 个新的跨模态和跨配对检索任务上提出了名为 Omni-Retrieval 的方法。结果表明,该模型在细调后在 7 个与商业相关的下游任务中实现了最先进的性能。