Jan, 2024

擅长标题,计数能力差:在地球观测数据上评估 GPT-4V

TL;DR对大型视觉语言模型在地球观测数据中的能力进行了评估,发现其在场景理解和空间推理等任务上表现出色,但在物体定位和计数任务上有一定局限性,因此提出了一个全面的评估基准。