Dec, 2023

语言驱动的视觉概念学习

TL;DR通过从大型预训练的视觉语言模型中提取和训练一组概念编码器,我们的目标是学习一种以语言为导向的视觉概念表示,以重现输入图像,并通过遵循一组与视觉相关的概念轴从新的测试图像中提取概念嵌入,从而生成具有视觉概念新组合的图像。