有缺失数据的目录中变星的自动分类

Oct, 2013

有缺失数据的目录中变星的自动分类

Automatic Classification of Variable Stars in Catalogs with missing data

Karim Pichara, Pavlos Protopapas

TL;DR本文提出了一种利用贝叶斯网络进行天文目录分类的自动分类方法，利用基于采样的期望最大化算法来学习贝叶斯网络，并在SAGE、2MASS和UBVI等缺失数据的目录和一个完整的目录上测试了该方法，发现该方法在减少计算成本的同时提高了变量物体分类准确性。

Abstract

We present an automatic classification method for astronomical catalogs with missing data. We use →

发现论文，激发创造

变星的深度多次观测分类

本研究提出了一种基于卷积神经网络的深度学习模型，通过灵活的数据增强和无需特征的卷积层，能够高效准确地实现光变星分类。

Oct, 2018

概率随机森林：一种用于嘈杂数据集的机器学习算法

本研究修改了基于随机森林(Random Forest，RF)的算法，提出了一种新的基于概率随机森林(Probabilistic Random Forest，PRF)的机器学习算法，用于处理带有不确定性的天文数据，能够有效提高分类准确性以及应用于转移学习。

Nov, 2018

可扩展的端到端循环神经网络用于变星分类

本文提出了一种基于深度学习的、端到端的自动变星分类算法，通过将光变曲线转化成矩阵表示来学习特征并实现自动分类，取得了与随机森林分类器相当的准确率，但计算速度更快、可扩展性更强。

Feb, 2020

采用从错误中学习的线性支持向量机进行类星体检测

本文探讨了使用线性支持向量机技术检测类星体的方法，并结合集成装袋树技术，在考虑分类不平衡和错误成本的基础上对其性能进行了评估，取得了False Negative Rate的10倍降低。

Oct, 2020

建构具有影响力的天文机器学习研究：研究人员和审稿人的最佳实践

尽管机器学习方法在天文学领域得到了广泛应用且不断发展，但目前天体物理文献中对于实施机器学习模型和报告结果的最佳实践、挑战和局限性，往往尚未完全报道。因此，本文旨在为天文学界的作者、审稿人和编辑提供入门指南，解决该问题，并确保结果的准确性、研究结果的可重复性和方法的实用性。

Oct, 2023

基于天体目录的场级别模拟推断：系统效应的影响

使用图神经网络对包含多种观测效应的星系目录进行训练和测试，发现尽管这些效应降低了模型的精度和准确性，增加了模型失效的星系目录比例，但模型表现良好的星系目录比例超过90％，从而展示了这些模型在应用于真实数据时约束宇宙学参数的潜力。

Oct, 2023

天体物理X射线源的无监督机器学习分类

通过无监督机器学习方法，我们为Chandra Source Catalog的源提供了概率分类，并展示了该方法在识别年轻恒星物体的发射以及区分小尺度和大尺度紧凑吸积源方面的成功，为这种概率分类器提供了可解释性。

Jan, 2024

地球观测应用模型预测中缺失数据的影响评估

地球观测应用中使用机器学习模型来处理复杂和异构的数据源，但是对于数据源的持久性可用性存在一种常见的假设。本研究评估了训练模型中缺失时间性和静态的观测数据源对于四个数据集中分类和回归任务的影响，并比较了不同方法的预测质量，发现其中一些方法对于缺失数据自然更具鲁棒性。特别是，集成策略实现了高达100％的预测稳健性。我们发现，在回归任务中缺失情景比分类任务更具挑战性。最后，我们发现当光学视图单独缺失时，它是最关键的视图。

Mar, 2024

基于分类器的多类异常检测方法用于天文暂现现象

利用神经网络分类器的倒数第二层作为潜在空间来检测异常，引入一种名为多类孤立森林的新方法，在给定分类器生成的潜在空间表示下，为光曲线导出异常得分，该方法明显优于标准的孤立森林，并在实时异常检测中有效地重用了分类器。

Mar, 2024

一见钟情：基于大型多模态模型的天文图像零样本分类

使用自然语言提示，无需额外训练即可实现视觉－语言多模态模型对低表面亮度星系和艺术品的零样本分类以及星系形态分类，在自然语言提示下，这些模型通常能够实现显著的准确度（通常在80％以上），我们讨论了一些需要改进的领域，特别是LLaVA-NeXT，这是一个开源模型，我们的研究结果旨在激励天文学界将视觉－语言多模态模型视为研究和教育的强大工具，并希望未来定制或优化的模型能够表现更好。

Jun, 2024