CVPRMay, 2024

LLMGeo: 大规模语言模型在野外图像地理定位中的基准测试

TL;DR利用多模态语言模型,我们系统评估其图片地理定位能力,并通过新的图像数据集和全面的评估框架进行训练及非训练的评估。结果表明,闭源模型展示出更好的地理定位能力,而开源模型通过微调可达到相当的性能。