Mar, 2023

CoBIT:一种对比式双向图像文本生成模型

TL;DR提出了一个新的 Contrastive Bi-directional Image-Text generation (CoBIT) 模型,具有 unicoder-decoder 结构,可同时应用于图像理解、图像与文本相互理解和文本创作,特别是在零样本场景下表现卓越。