Nov, 2023

GPT-4V 作为视觉语言任务的通用评估器

TL;DRGPT-4V 在多模态任务的普遍评估方面展现出了巨大的潜力,尽管存在一些限制,但其与人类的一致性以及提供详细解释的能力为通用自动评估器提供了希望。