机器学习在科学发现中的机遇
本文回顾了可解释的机器学习,探讨了在自然科学领域应用中的透明度、可解释性和解释性三个核心要素,并提供了结合应用领域的领域知识使用可解释的机器学习的最近科学作品的概述。
May, 2019
本文介绍了机器学习在地球科学问题中所面临的独特挑战和机遇,强调各种地球科学问题所需的新颖机器学习方法的重要性,并讨论了潜在的方法学发展方向及其在地球科学中的应用。
Nov, 2017
本文综述了机器学习和物理科学之间的接口,包括机器学习的基本概念,如何用统计物理学理解机器学习方法,机器学习方法在粒子物理学、宇宙学、量子物理学、量子计算和化学、材料物理学中的应用,以及加速机器学习的新型计算架构的研究和开发。
Mar, 2019
本文探讨了机器学习与传统基于物理模型的建模方法相结合解决复杂科学和工程问题的创新方法,总结了这些方法的应用领域,并描述了用于构建基于物理引导的机器学习模型和混合物理 - 机器学习框架的分类方法,提出了现有技术的分类方法,揭示了知识漏洞和不同学科间方法的潜在交叉点,可用作未来研究的思路。
Mar, 2020
通过解释性机器学习,可以从大数据集中生成新的知识或进行发现,验证这些发现有助于提高机器学习系统的可信度和科学的可重复性。从实践和理论两个角度出发,我们讨论解释性机器学习的技术与挑战。
Aug, 2023
科学建模的综述及与基于过程的模型相比,机器学习方法在科学建模中的互补优势和不足;以及科学知识引导的机器学习(KGML)领域的研究现状介绍,旨在利用科学知识和数据在机器学习框架中实现更好的泛化性、科学一致性和可解释性的结果;我们讨论了 KGML 研究的不同方面:使用的科学知识类型、知识 - 机器学习集成的形式以及在机器学习中融入科学知识的方法;同时,我们还讨论了环境科学中 KGML 方法正在开发的常见应用类别,并提供了每个类别的例证。
Mar, 2024
机器学习(ML)在各个科学领域产生了巨大的影响,然而,ML 具有强大的本体论和认识论,在自然科学中与标准实践和关键哲学观念存在强烈冲突。本文识别了 ML 在自然科学中的一些有价值的应用领域,如使用表达能力强的机器学习模型进行因果推断来表示混淆因素的影响。此外,我们还展示了引入 ML 会引起强烈的、不希望的统计偏差的情况,例如,当 ML 模型用于模拟物理(或基于原理)时,会引入强烈的确认偏差。因此,我们呼吁科学界退后一步,考虑 ML 在各自领域中的作用和价值。
May, 2024
现代生命科学研究越来越依赖于人工智能方法来模拟生物系统,主要集中在使用机器学习模型上。然而,机器学习在生物科学中的广泛应用表明其与传统科学探究方法存在显著差异,这种相互作用对未来的科学研究具有重要意义,但却受到较少关注。在本研究中,我们借鉴认识论工具集,将机器学习在生物科学中的最新应用放入现代哲学理论的框架下,以识别可指导机器学习系统为生物现象建模和推动科学知识进展的一般原则。我们提出,科学理解作为信息压缩、定性可理解性和依赖关系建模的概念,为解释机器学习介导的生物系统理解提供了有用的框架。通过对现代生物研究中机器学习的两个关键应用领域 —— 蛋白质结构预测和单细胞 RNA 测序的详细分析,我们探讨了这些特征迄今如何使机器学习系统推进对目标现象的科学理解,以及它们如何指导未来机器学习模型的发展,以及阻碍机器学习实现其作为生物发现工具潜力的关键障碍。考虑机器学习在生物学应用中的认识论特征将改善这些方法解决重要问题和推进对生命系统科学理解的前景。
Mar, 2024
这篇文章利用自然语言处理技术,针对多个领域的相关研究文献分析了深度学习技术的扩散和影响,在研究健康科学的过程中发现,深度学习技术的采用虽然与知识结构的颠覆和再组合的新颖性呈现负相关,但却能提高期望和引用性能方面的变异性。因此,深度学习方法可以作为一种通用的科学方法,以可衡量的方式推动科学的进展。
Sep, 2020