有缺失数据的目录中变星的自动分类
本研究修改了基于随机森林(Random Forest,RF)的算法,提出了一种新的基于概率随机森林(Probabilistic Random Forest,PRF)的机器学习算法,用于处理带有不确定性的天文数据,能够有效提高分类准确性以及应用于转移学习。
Nov, 2018
本文提出了一种基于深度学习的、端到端的自动变星分类算法,通过将光变曲线转化成矩阵表示来学习特征并实现自动分类,取得了与随机森林分类器相当的准确率,但计算速度更快、可扩展性更强。
Feb, 2020
本文探讨了使用线性支持向量机技术检测类星体的方法,并结合集成装袋树技术,在考虑分类不平衡和错误成本的基础上对其性能进行了评估,取得了False Negative Rate的10倍降低。
Oct, 2020
尽管机器学习方法在天文学领域得到了广泛应用且不断发展,但目前天体物理文献中对于实施机器学习模型和报告结果的最佳实践、挑战和局限性,往往尚未完全报道。因此,本文旨在为天文学界的作者、审稿人和编辑提供入门指南,解决该问题,并确保结果的准确性、研究结果的可重复性和方法的实用性。
Oct, 2023
使用图神经网络对包含多种观测效应的星系目录进行训练和测试,发现尽管这些效应降低了模型的精度和准确性,增加了模型失效的星系目录比例,但模型表现良好的星系目录比例超过90%,从而展示了这些模型在应用于真实数据时约束宇宙学参数的潜力。
Oct, 2023
通过无监督机器学习方法,我们为Chandra Source Catalog的源提供了概率分类,并展示了该方法在识别年轻恒星物体的发射以及区分小尺度和大尺度紧凑吸积源方面的成功,为这种概率分类器提供了可解释性。
Jan, 2024
地球观测应用中使用机器学习模型来处理复杂和异构的数据源,但是对于数据源的持久性可用性存在一种常见的假设。本研究评估了训练模型中缺失时间性和静态的观测数据源对于四个数据集中分类和回归任务的影响,并比较了不同方法的预测质量,发现其中一些方法对于缺失数据自然更具鲁棒性。特别是,集成策略实现了高达100%的预测稳健性。我们发现,在回归任务中缺失情景比分类任务更具挑战性。最后,我们发现当光学视图单独缺失时,它是最关键的视图。
Mar, 2024
利用神经网络分类器的倒数第二层作为潜在空间来检测异常,引入一种名为多类孤立森林的新方法,在给定分类器生成的潜在空间表示下,为光曲线导出异常得分,该方法明显优于标准的孤立森林,并在实时异常检测中有效地重用了分类器。
Mar, 2024
使用自然语言提示,无需额外训练即可实现视觉-语言多模态模型对低表面亮度星系和艺术品的零样本分类以及星系形态分类,在自然语言提示下,这些模型通常能够实现显著的准确度(通常在80%以上),我们讨论了一些需要改进的领域,特别是LLaVA-NeXT,这是一个开源模型,我们的研究结果旨在激励天文学界将视觉-语言多模态模型视为研究和教育的强大工具,并希望未来定制或优化的模型能够表现更好。
Jun, 2024