nbi：天文学家神经后验估计包

Dec, 2023

nbi: the Astronomer's Package for Neural Posterior Estimation

Keming Zhang, Joshua Bloom, Stéfan van der Walt, Nina Hernitschek

TL;DR在天文学中，为了解决神经后验估计方法的三个关键问题，我们引入了一个新的框架和开源软件nbi（神经贝叶斯推断），该框架支持自动化和序列化的神经后验估计方法，并提供了内置的自动化网络和修改后的算法 SNPE-IS，从而实现了光曲线和光谱等天文推断问题的快速应用。

Abstract

Despite the promise of neural posterior estimation (NPE) methods in astronomy, the adaptation of NPE into the routine inference workflow has been slow. We identify three critical issues: the need for custom featurizer n

发现论文，激发创造

SKYNET: 一种高效且稳健的神经网络训练工具，用于天文学中的机器学习

SkyNet是一个高效且强大的机器学习工具，可用于训练大型、深层的前馈神经网络，包括自编码器。使用预训练方法和正则化牛顿方法进行优化，避免了标准反向传播技术在优化复杂网络方面的困难，SkyNet的实用性和灵活性在一些例题和天文学问题上得到了展示。

Sep, 2013

使用变分贝叶斯神经网络约束N体模拟的宇宙学参数

本文介绍了基于深度学习的近似贝叶斯神经网络和多项式归一化流方法，应用于天体物理参数恢复，发现与标准贝叶斯神经网络和翻转估计器相比，该方法能够更好地提高预测性能和准确估计不确定性，缓解变分参数的误差引入，并得到更接近真实后验分布的预测分布，从而为使用网络提供更合理的预测分布。该方法提高了维度的灵活性，有助于恢复大量的天体物理参数。

Jan, 2023

NAUTILUS: 用深度学习增强贝叶斯重要性嵌套采样

本文介绍了通过神经网络回归将INS与深度学习相结合的NAUTILUS方法，用于贝叶斯后验和证据估计，该方法的采样效率高于其他取样器。

Jun, 2023

Astroconformer: 基于Transformer的深度学习模型分析恒星光度曲线的前景

星体震荡、颗粒化、光曲线、机器学习和Astroconformer构成了这篇论文的主要研究内容。

Sep, 2023

建构具有影响力的天文机器学习研究：研究人员和审稿人的最佳实践

尽管机器学习方法在天文学领域得到了广泛应用且不断发展，但目前天体物理文献中对于实施机器学习模型和报告结果的最佳实践、挑战和局限性，往往尚未完全报道。因此，本文旨在为天文学界的作者、审稿人和编辑提供入门指南，解决该问题，并确保结果的准确性、研究结果的可重复性和方法的实用性。

Oct, 2023

用摊销的神经后验估计和能量果蝇算法拟合恒星光谱

借助Amortized Neural Posterior Estimation（ANPE）技术以及新的nbi软件包，本研究为APOGEE星光谱调查提供了一个训练有素的ANPE模型，展示了其在模拟和真实APOGEE星光谱上的功效。我们引入了一种有效处理光谱数据中固有测量噪声特性的方法，利用了观测数据中的实际不确定性，使训练数据能够类似于观测数据，这对于ANPE应用至关重要。此外，我们探讨了ANPE“模型库”的实用性，其中针对特定仪器进行模型训练，并在nbi框架下分发，以促进实时的恒星参数推断。

Dec, 2023

利用流匹配和神经重要性抽样推断系外行星的大气特性

大气检索通过估计观测光谱中的大气参数来表征外行星，通常将其作为贝叶斯推断问题来解决。我们探索了基于流匹配后验估计（FMPE）的机器学习方法用于大气检索，并发现在这种情况下，它比神经后验估计（NPE）更准确，但比嵌套采样方法的准确性稍低。我们将FMPE和NPE与重要性采样相结合，两种方法在准确性和模拟效率方面均优于嵌套采样。进一步分析表明，基于仿真和基于似然的重要性采样提供了一个准确高效的大气检索框架，不仅可以用于分析现有望远镜的观测数据，还可以用于新任务和仪器的开发。

Dec, 2023

FlopPITy: 用机器学习实现自洽行星大气逆推

利用机器学习推断算法SNPE，我们能够以更高的计算效率运行可靠的外行星大气解译检索，并加速检索速度，提高计算耗费大气模型的可行性。

Jan, 2024

无线电天文学中带有模型不确定性量化的R2D2图像重建

这篇研究论文使用Residual-to-Residual DNN（R2D2）方法进行高动态范围成像，通过集成学习的方式生成多个R2D2实例，从而提供了一种同时估计和量化不确定性的功能。结果表明，R2D2的图像估计能力优于现有算法，计算多个重建样本和不确定性图在大图像尺寸下也非常实用，并且模型的不确定性非常低。

Mar, 2024

AstroMLab 1：谁能赢得天文知识问答？

通过使用第一个专门为天文学设计的基准数据集，我们全面评估了专有和开放权重的大型语言模型。我们的分析检查了模型在各种天文学子领域的性能，并评估了响应校准，对于潜在在研究环境中的部署至关重要。Claude-3.5-Sonnet在精度上优于竞争对手高达4.6个百分点，达到了85.0%的准确率。对于专有模型，我们观察到实现相似分数在特定的天文学基准测试中每隔3到12个月普遍降低成本。开源模型已经得到快速改进，LLaMA-3-70b（80.6%）和Qwen-2-72b（77.7%）现在已经与一些最好的专有模型竞争。我们发现在各个主题上存在性能差异，非以英语为重点的模型通常在系外行星相关领域、恒星天体物理学和仪器相关问题上更困难。这些挑战可能来自训练数据较少、历史背景有限以及这些领域的快速最新发展。这种模式在开放权重模型和专有模型中都存在，显示了培训数据多样性对模型在专业科学领域中的性能影响。表现最好的模型表现出良好的校准自信度，在自信度和正确性之间的相关性超过0.9，尽管它们倾向于稍微缺乏自信。快速、低成本推理的开放权重模型的发展为在天文学中实现经济部署提供了新的机会。观察到的快速进展表明，利用大型语言模型驱动的天文学研究可能在不久的将来成为可能。

Jul, 2024