EarthPT:地球观测的基础模型
该论文介绍了 AstroPT,这是一个针对天文学应用开发的自回归预训练变换器。AstroPT 模型在 DES Legacy Survey DR8 的 860 万个 512×512 像素 grz 带星系邮票观测数据上进行了预训练。我们训练了一系列不断增长参数的基础模型,其参数从 100 万个到 21 亿个,发现 AstroPT 遵循与文本模型类似的饱和的对数 - 对数缩放规律。我们还发现,模型性能在线性探测方面随着模型大小的增加而提高,直到模型参数饱和点。我们相信,协作社区开发是实现开源的 “大观测模型” 的最佳途径,即采用与自然语言处理中所见规模相同的观测科学数据进行训练的模型。为此,我们在 MIT 许可下发布 AstroPT 的源代码、权重和数据集,并邀请潜在合作者与我们共同构建和研究这些模型。
May, 2024
本研究介绍了 PhilEO Bench,这是一个用于评估遥感基础模型的创新评估框架,其中包括一个测试平台和一个包含建筑密度估计、道路分割和土地覆盖分类三个下游任务的 400GB Sentinel-2 数据集。通过使用该框架对 Prithvi 和 SatMAE 等不同基础模型进行多个 n-shot 和收敛率的实验评估。
Jan, 2024
基于深度学习的 Prithvi 地球观测模型通过高效前期训练和微调,成功实现地球观测领域多个任务的优化,证明了预训练模型在加速微调过程以及在性能上优于随机初始化权重的作用,并表明可显著减少可用标注数据的数量而不影响模型准确性。
Oct, 2023
通过预测与未来天气相关的卫星图像,借助大规模数据集和深度神经网络模型进行天气预测,从而有助于农作物产量预测、森林健康评估或生物多样性监测等下游应用。
Apr, 2021
本文介绍了 EchoPT,一种先训练的变压器架构,旨在通过先前的感知数据和机器人自我运动信息预测 2D 声纳图像,以实现稳健的机器人行为,并比较该模型与几种最先进的技术的性能。同时展示了这种预测感知方法在两个机器人任务中的有效性。
May, 2024
利用未标记的地球观测数据创建多模态预训练数据集,通过多模态预训练任务,提出了改进的 ConvNeXt V2 架构的 Multi-Pretext Masked Autoencoder (MP-MAE) 方法,证明多模态预训练可以显著提高图像分类和语义分割的性能,以及标签和参数的效率。
May, 2024
提出了一个先驱性的多模态大型语言模型(MLLM)EarthGPT,该模型集成了各种多传感器遥感图像解释任务,通过构建大规模的多传感器多模态遥感指令追踪数据集 MMRS,解决了 MLLM 在遥感领域缺乏专业知识的问题,并在各种遥感图像解释任务上展现出其卓越的性能,并为开放式推理任务提供了一种多功能的范例。
Jan, 2024
本文介绍了 SSL4EO-L 数据集的设计,使用该数据集现代化并重新发布了 L7 Irish 和 L8 Biome 云检测数据集,并推出了 Landsats 4-5 TM 和 Landsat7 ETM+ SR 的 ML 基准数据集,使用 SSL4EO-L 预训练了 Landsat 影像的基础模型,并在多个语义分割任务上评估了它们的性能。
Jun, 2023
基于神经可塑性的多模态地球观测数据的适应性单一框架 ——Dynamic One-For-All(DOFA)模型提供了更准确、高效和统一的地球观测分析方法。
Mar, 2024
本研究针对遥感任务的基础模型研究进行了探讨,提出了一种包括六项分类任务和六项分割任务的基准测试以及可靠的评估方法,并报告了二十种基线模型的结果,旨在推动地球监测领域的模型进展。
Jun, 2023