Mar, 2025
RoMA:扩展基于Mamba的遥感基础模型
RoMA: Scaling up Mamba-based Foundation Models for Remote Sensing
TL;DR本文研究了自监督学习在视觉变换器(ViTs)中对遥感基础模型的应用,但由于自注意力的平方复杂性,扩展性受到限制。我们提出了RoMA框架,通过自适应的旋转感知预训练机制和多尺度令牌预测目标,有效利用大规模多样化的无标签数据,提升了高分辨率遥感图像的可扩展性。实验表明,RoMA预训练的Mamba模型在准确性和计算效率上均优于基于ViT的模型。