CVPRMay, 2024
LLMGeo: 大规模语言模型在野外图像地理定位中的基准测试
LLMGeo: Benchmarking Large Language Models on Image Geolocation In-the-wild
Zhiqiang Wang, Dejia Xu, Rana Muhammad Shahroz Khan, Yanbin Lin, Zhiwen Fan...
TL;DR利用多模态语言模型,我们系统评估其图片地理定位能力,并通过新的图像数据集和全面的评估框架进行训练及非训练的评估。结果表明,闭源模型展示出更好的地理定位能力,而开源模型通过微调可达到相当的性能。