Jan, 2024
仅使用文本监督在视觉-语言模型中学习提示
Learning to Prompt with Text Only Supervision for Vision-Language Models
Muhammad Uzair Khattak, Muhammad Ferjad Naeem, Muzammal Naseer, Luc Van Gool, Federico Tombari
TL;DR本研究提出了一种使用仅文本数据学习通用提示的方法,通过将LLL(large language models)中的上下文数据映射到学习到的提示中,实现了零样本转移,并在4个基准测试上进行了广泛评估。