Nov, 2023

GPT4Vis:GPT-4能为零样本视觉识别做什么?

TL;DR本研究对GPT-4在零样本视觉识别任务中的语言和视觉能力进行了评估,发现利用GPT-4生成丰富的文本描述明显提高了零样本识别性能,并且在视觉熟练度方面,GPT-4V在16个基准数据集中表现介于OpenAI-CLIP的ViT-L和EVA-CLIP的ViT-E之间。