Nov, 2024

COREval:评估大型视觉-语言模型遥感能力的综合性和客观性基准

TL;DR本研究针对大型视觉-语言模型(VLMs)在遥感领域能力评估缺乏全面基准的问题,提出了COREval基准,以客观评估这些模型的遥感能力。通过六个次维度和二十二个具体任务的细致分类,COREval确保对6,263个问题的严格质量控制,帮助识别当前模型的短板,促进其在遥感应用中的改善。