Jul, 2022

对比交叉模态知识共享预训练用于视觉语言表示学习和检索

TL;DR本研究提出了一种名为 COOKIE 的对比交叉模态知识共享预训练方法,采用传统的双流结构并结合两个有效的模块实现文本 - 图像联合表征,旨在提高跨模态检索的计算效率和统计指标。