机器学习在科学发现中的机遇

May, 2024

Opportunities for machine learning in scientific discovery

Ricardo Vinuesa, Jean Rabault, Hossein Azizpour, Stefan Bauer, Bingni W. Brunton...

TL;DR科学界利用机器学习技术进行科学探索的能力正在初生阶段，然而，机器学习的原理应用正在为基础科学发现开辟新的途径，尤其在处理观测数据的复杂性方面。

Abstract

Technological advancements have substantially increased computational power and data availability, enabling the application of powerful machine-learning (ML) techniques across various fields. However, our ability to leverage ML methods for scientific discovery, {\it i.e.} to obtain fun

machine learning techniques scientific discovery problem domain governing equations observational data

发现论文，激发创造

可解释的机器学习用于科学洞见与发现

本文回顾了可解释的机器学习，探讨了在自然科学领域应用中的透明度、可解释性和解释性三个核心要素，并提供了结合应用领域的领域知识使用可解释的机器学习的最近科学作品的概述。

May, 2019

地球科学中的机器学习：挑战与机遇

本文介绍了机器学习在地球科学问题中所面临的独特挑战和机遇，强调各种地球科学问题所需的新颖机器学习方法的重要性，并讨论了潜在的方法学发展方向及其在地球科学中的应用。

Nov, 2017

机器学习与物理科学

本文综述了机器学习和物理科学之间的接口，包括机器学习的基本概念，如何用统计物理学理解机器学习方法，机器学习方法在粒子物理学、宇宙学、量子物理学、量子计算和化学、材料物理学中的应用，以及加速机器学习的新型计算架构的研究和开发。

Mar, 2019

将科学知识与机器学习相结合，用于工程和环境系统

本文探讨了机器学习与传统基于物理模型的建模方法相结合解决复杂科学和工程问题的创新方法，总结了这些方法的应用领域，并描述了用于构建基于物理引导的机器学习模型和混合物理 - 机器学习框架的分类方法，提出了现有技术的分类方法，揭示了知识漏洞和不同学科间方法的潜在交叉点，可用作未来研究的思路。

Mar, 2020

可解释的机器学习对于发现的统计挑战与机遇

通过解释性机器学习，可以从大数据集中生成新的知识或进行发现，验证这些发现有助于提高机器学习系统的可信度和科学的可重复性。从实践和理论两个角度出发，我们讨论解释性机器学习的技术与挑战。

Aug, 2023

知识导向的机器学习：当前趋势与未来前景

科学建模的综述及与基于过程的模型相比，机器学习方法在科学建模中的互补优势和不足；以及科学知识引导的机器学习（KGML）领域的研究现状介绍，旨在利用科学知识和数据在机器学习框架中实现更好的泛化性、科学一致性和可解释性的结果；我们讨论了 KGML 研究的不同方面：使用的科学知识类型、知识 - 机器学习集成的形式以及在机器学习中融入科学知识的方法；同时，我们还讨论了环境科学中 KGML 方法正在开发的常见应用类别，并提供了每个类别的例证。

Mar, 2024

机器学习对自然科学是利是弊？

机器学习（ML）在各个科学领域产生了巨大的影响，然而，ML 具有强大的本体论和认识论，在自然科学中与标准实践和关键哲学观念存在强烈冲突。本文识别了 ML 在自然科学中的一些有价值的应用领域，如使用表达能力强的机器学习模型进行因果推断来表示混淆因素的影响。此外，我们还展示了引入 ML 会引起强烈的、不希望的统计偏差的情况，例如，当 ML 模型用于模拟物理（或基于原理）时，会引入强烈的确认偏差。因此，我们呼吁科学界退后一步，考虑 ML 在各自领域中的作用和价值。

May, 2024

人工智能时代的生物学理解

现代生命科学研究越来越依赖于人工智能方法来模拟生物系统，主要集中在使用机器学习模型上。然而，机器学习在生物科学中的广泛应用表明其与传统科学探究方法存在显著差异，这种相互作用对未来的科学研究具有重要意义，但却受到较少关注。在本研究中，我们借鉴认识论工具集，将机器学习在生物科学中的最新应用放入现代哲学理论的框架下，以识别可指导机器学习系统为生物现象建模和推动科学知识进展的一般原则。我们提出，科学理解作为信息压缩、定性可理解性和依赖关系建模的概念，为解释机器学习介导的生物系统理解提供了有用的框架。通过对现代生物研究中机器学习的两个关键应用领域 —— 蛋白质结构预测和单细胞 RNA 测序的详细分析，我们探讨了这些特征迄今如何使机器学习系统推进对目标现象的科学理解，以及它们如何指导未来机器学习模型的发展，以及阻碍机器学习实现其作为生物发现工具潜力的关键障碍。考虑机器学习在生物学应用中的认识论特征将改善这些方法解决重要问题和推进对生命系统科学理解的前景。

Mar, 2024

科学中的深度学习

这篇文章利用自然语言处理技术，针对多个领域的相关研究文献分析了深度学习技术的扩散和影响，在研究健康科学的过程中发现，深度学习技术的采用虽然与知识结构的颠覆和再组合的新颖性呈现负相关，但却能提高期望和引用性能方面的变异性。因此，深度学习方法可以作为一种通用的科学方法，以可衡量的方式推动科学的进展。

Sep, 2020

机器学习在流体力学实验中的转化潜力

机器学习在实验流体力学领域具有重要的应用前景，可以提高测量技术的保真度和质量，改进实验设计和数值模型，并实现实时估计和控制。

Mar, 2023