天文学中的数据挖掘与机器学习
本文主要介绍了天文学中大数据和机器学习的应用,重点讲解了监督机器学习和无监督机器学习两种算法,包括数据预处理、评估方法、支持向量机、随机森林、浅层神经网络、聚类分析、降维、可视化和异常检测等方面,旨在提高天文学家使用这些工具从海量数据中挖掘新知识的能力。
Apr, 2019
尽管机器学习方法在天文学领域得到了广泛应用且不断发展,但目前天体物理文献中对于实施机器学习模型和报告结果的最佳实践、挑战和局限性,往往尚未完全报道。因此,本文旨在为天文学界的作者、审稿人和编辑提供入门指南,解决该问题,并确保结果的准确性、研究结果的可重复性和方法的实用性。
Oct, 2023
本文探讨机器学习技术如何辅助科学战略规划。作者使用高影响力天文期刊的摘要,运用潜在狄利克雷分配(Latent Dirichlet Allocation)的方法,找到了可以预测研究兴趣的领先指示器,并证明这种方法可以较好地反映出 2010 年全国科学院天文与天体物理学十年规划科学前沿小组确定的优先研究领域。作者还提出两种度量方法:一种是所有科学论文贡献率之和的度量方法,另一种是这些计数的复合年增长率,这些方法展现出与相同十年规划中提交的白皮书相同的相关性。结果表明,十年规划未能充分强调快速增长的研究。
Mar, 2022
机器学习可以在太阳物理学中应用,帮助我们更深入地了解太阳大气中发生的复杂过程,并通过更复杂的模型来解释数据以及通过自动化分析太阳数据,减少人工劳动,提高研究效率。
Jun, 2023
本文研究了多波段数据分类问题,使用了学习向量量化、单层感知器和支持向量机三种机器学习算法,并使用了特征选择技术进行特征重要性评价。结果表明,在特征较少时,学习向量量化和单层感知器具有更好的性能,而在考虑更多特征时,支持向量机具有更好性能。该方法可以用于预选 AGN 候选对象。
Mar, 2004
太阳系小天体的科学研究最终从对这些天体的搜索开始。本章对使用机器学习技术在天文图像中寻找移动天体(包括自然和人造天体)的方法进行了综述。综述包括了传统非机器学习技术的简要回顾以及相对不成熟的机器学习文献中的三大类方法:流迹检测、图像序列中移动点源的检测以及位移堆叠搜索中移动源的检测。在大多数情况下,人们使用卷积神经网络,这是很自然的选择。文章还介绍了两个例子网络:一种我设计的残差网络,用于各种位移堆叠搜索,以及一种专门设计用于预测源亮度及其不确定性的卷积神经网络。在讨论文献和例子网络时,我还讨论了机器学习技术的各种潜在问题,包括过拟合的重要问题。我还讨论了与机器学习技术相关的各种陷阱以及在将机器学习应用于新问题时的最佳实践方法,包括创建稳健的训练集、验证和避免过拟合的训练方法。
May, 2024
本文介绍了机器学习在地球科学问题中所面临的独特挑战和机遇,强调各种地球科学问题所需的新颖机器学习方法的重要性,并讨论了潜在的方法学发展方向及其在地球科学中的应用。
Nov, 2017
本文综述了机器学习和物理科学之间的接口,包括机器学习的基本概念,如何用统计物理学理解机器学习方法,机器学习方法在粒子物理学、宇宙学、量子物理学、量子计算和化学、材料物理学中的应用,以及加速机器学习的新型计算架构的研究和开发。
Mar, 2019