科学机器学习中基于多种准确度的线性回归模型从稀少数据中学习

Mar, 2024

科学机器学习中基于多种准确度的线性回归模型从稀少数据中学习

Multifidelity linear regression for scientific machine learning from scarce data

Elizabeth Qian, Anirban Chaudhuri, Dayoung Kang, Vignesh Sella

TL;DR在科学机器学习中，我们提出了一种新的多保真度训练方法，利用可用的不同保真度和成本的数据，通过多保真度数据定义线性回归模型的未知参数的新的多保真度蒙特卡罗估计器，并提供理论分析以保证该方法的准确性和对较小训练预算的改进鲁棒性。数值结果验证了理论分析，并表明与仅具有相似成本的高保真度数据训练的标准模型相比，我们用稀缺高保真度数据和额外低保真度数据训练的多保真度学习模型具有数量级更低的模型方差，说明在稀缺数据环境下，我们的多保真度训练策略能够产生具有较低期望误差的模型。

Abstract

machine learning (ML) methods, which fit to data the parameters of a given parameterized model class, have garnered significant interest as potential methods for learning surrogate models for complex engineering

machine learning surrogate models multifidelity training linear regression models model variance

发现论文，激发创造

物理学中回归问题的多准确度高斯过程代理建模

通过比较多种多保真度方法构建高斯过程代理进行回归，我们发现多保真度方法通常具有较小的预测误差，且对于相同计算成本而言，其效果因不同场景而异。

Apr, 2024

多保真代理模型：一种新的数据融合视角

多重保真度代理模型结合了不同来源的准确性和成本不同的数据。它战略性地使用低保真度模型进行快速评估，节省计算资源，并使用高保真度模型进行详细优化，它通过解决不确定性和超越单一保真度模型的限制来改善决策。融合高保真度数据用于详细响应，并且频繁融合低保真度数据用于快速近似，有助于在各个领域进行设计优化。

Apr, 2024

控制变量的多保真度强化学习

研究了基于多种保真度数据的强化学习问题，并提出了一种基于控制变量的多能级估计器以及基于多功能 Monte Carlo RL 方法来提高代理人在高保真度环境中的学习性能。

Jun, 2022

残差多保真神经网络计算

基于多重真实度信息构建神经网络替代模型的残差多重真实度计算框架，通过两个神经网络的协同作用，利用残差函数建立了模型之间的相关性，并通过生成合成的高真实度数据来实现构建代表高真实度感兴趣量的替代模型以在小容差范围内获得准确预测的巨大计算成本节约。

Oct, 2023

多层次气候模型参数化以提升泛化与外推能力

多重保真度方法通过整合不同准确度和丰富度的数据集，结合了基于物理的参数化和基于机器学习的参数化，使得在训练数据范围外进行外推成为可能，且能够提供更高准确性的气候预测模拟，而不需要大量计算资源增加。

Sep, 2023

多保真度剥离深度贝叶斯主动学习

为了解决高维数据下基于高斯过程的多保真度主动学习不易扩展以及传递误差的问题，我们提出了一种基于解缠混淆的深度贝叶斯学习框架，可以在多个保真度下学习代理模型的分布函数。

May, 2023

多保真度降阶代理建模

应用多保真度替代建模方法，结合降维技术和神经网络代理，能有效地恢复高保真度数值模拟，捕捉系统的不稳定性和临界瞬变特征。

Sep, 2023

扩散生成多保真学习与物理模拟

基于随机微分方程的扩散生成多保真度（DGMF）学习方法通过连续去噪过程生成解决方案输出，同时利用条件分数模型控制解决方案的生成，可有效学习和预测多维解决方案数组，将离散和连续保真度建模统一，展示了多保真度学习的有希望的新方向。

Nov, 2023

物理系统连续学习的多保真度方法

提出一种基于多保真深度神经网络的连续学习方法，限制灾难性遗忘，并能与已有的连续学习方法（包括重放和记忆感知突触）结合使用。该方法特别适合解决物理问题和基于物理的神经网络。

Apr, 2023

多保真度模拟、机器学习和搜索空间缩减策略在高效反设计优化中的应用

该研究介绍了一种方法，通过多精度评估、机器学习模型和优化算法的战略性协同，增强受有限计算资源约束的反向设计优化过程。该方法在两个不同的工程反向设计问题上进行了分析，通过在每个优化循环中利用训练有低精度模拟数据的机器学习模型，高效地预测目标变量并确定是否需要高精度模拟，从而显著节省了计算资源。此外，该机器学习模型在优化之前被战略性地使用以减小搜索空间，进一步加快了收敛到最优解的速度。该方法已被应用于增强差分进化和粒子群优化两种优化算法，对比分析表明两种算法的性能有所提升。值得注意的是，该方法适用于任何反向设计应用，实现了低精度机器学习模型和高精度模拟之间的和谐协同，并且可以无缝应用于任何种类的基于群体的优化算法。

Dec, 2023