Nov, 2023

对比式视觉-语言对齐提高指示学习效率

TL;DR通过将Contrastive和Generative方法应用于ViT和LLM的表示对齐,我们提出了CG-VLM模型,有效地实现了视觉-语言的对齐,成为一种高效的指令学习器。