Oct, 2023

科学数据的 Transformers:天文学的教育性回顾

TL;DRChatGPT 和相关生成 AI 产品所使用的深度学习架构被称为 transformers,从自然语言处理开始,transformers 和其所利用的自注意机制引起了自然科学领域的广泛关注。本文旨在介绍 transformers 给科学家,包括自注意机制的数学原理、原始 transformer 架构的描述,以及在天文学中应用于时间序列和图像数据的部分。此外,还提供了一个常见问题解答部分,供对生成 AI 感兴趣且希望用 transformers 解决研究问题的读者参考。