May, 2024

AstroPT:天文学观测模型的扩展

TL;DR该论文介绍了 AstroPT,这是一个针对天文学应用开发的自回归预训练变换器。AstroPT 模型在 DES Legacy Survey DR8 的 860 万个 512×512 像素 grz 带星系邮票观测数据上进行了预训练。我们训练了一系列不断增长参数的基础模型,其参数从 100 万个到 21 亿个,发现 AstroPT 遵循与文本模型类似的饱和的对数 - 对数缩放规律。我们还发现,模型性能在线性探测方面随着模型大小的增加而提高,直到模型参数饱和点。我们相信,协作社区开发是实现开源的 “大观测模型” 的最佳途径,即采用与自然语言处理中所见规模相同的观测科学数据进行训练的模型。为此,我们在 MIT 许可下发布 AstroPT 的源代码、权重和数据集,并邀请潜在合作者与我们共同构建和研究这些模型。