Dec, 2022

从图像到文本提示:使用Frozen大语言模型进行零样本VQA

TL;DR提出了Img2Prompt模块,它可以提供可以描述图像内容和自构建问题答案对的提示,并且能够帮助LLMs执行无需端到端训练的零射击VQA任务。