ICCVSep, 2023
LoGoPrompt:合成文本图像可以成为视觉 - 语言模型的良好视觉提示
LoGoPrompt: Synthetic Text Images Can Be Good Visual Prompts for Vision-Language Models
Cheng Shi, Sibei Yang
TL;DR本文通过引入合成文本图像作为类别相关的视觉提示,探索了视觉 - 语言模型中视觉提示的作用,并提出了一种 LoGoPrompt 方法,该方法在少样本学习、从基础到新领域的泛化以及领域泛化方面表现出一致优于现有方法的实验结果。