Mar, 2025

大型视觉语言模型与大型遥感图像的结合:粗到细的文本引导令牌修剪

TL;DR本研究解决了大型遥感图像(RSIs)理解中由于有限的预定义网格导致的信息损失问题,提出了一种结合动态图像金字塔的文本引导令牌修剪方法。研究结果表明,该方法在四个数据集上超越了现有的高分辨率策略,并在高分辨率设置下展示了更高的效率,具有重要的应用潜力和影响。