CVPRApr, 2023

电商大规模多模态预训练中的实例级表示学习

TL;DR本研究提出了一种实例为中心的多模态预训练范式 ECLIP,通过引入可学习实例查询的解码器架构和两个预处理任务,从 1 亿个电子商务相关数据中预训练出语义丰富、稳健的模型,进而在广泛的下游任务中超越现有方法,证明其在现实世界中的广泛可转移性。