May, 2024

MMEarth: 多模态预测任务研究地理空间表示学习

TL;DR利用未标记的地球观测数据创建多模态预训练数据集,通过多模态预训练任务,提出了改进的ConvNeXt V2架构的Multi-Pretext Masked Autoencoder (MP-MAE)方法,证明多模态预训练可以显著提高图像分类和语义分割的性能,以及标签和参数的效率。