Nov, 2023

GPT4Vis:GPT-4 能为零样本视觉识别做什么?

TL;DR本研究对 GPT-4 在零样本视觉识别任务中的语言和视觉能力进行了评估,发现利用 GPT-4 生成丰富的文本描述明显提高了零样本识别性能,并且在视觉熟练度方面,GPT-4V 在 16 个基准数据集中表现介于 OpenAI-CLIP 的 ViT-L 和 EVA-CLIP 的 ViT-E 之间。