Mar, 2024

科学机器学习中基于多种准确度的线性回归模型从稀少数据中学习

TL;DR在科学机器学习中,我们提出了一种新的多保真度训练方法,利用可用的不同保真度和成本的数据,通过多保真度数据定义线性回归模型的未知参数的新的多保真度蒙特卡罗估计器,并提供理论分析以保证该方法的准确性和对较小训练预算的改进鲁棒性。数值结果验证了理论分析,并表明与仅具有相似成本的高保真度数据训练的标准模型相比,我们用稀缺高保真度数据和额外低保真度数据训练的多保真度学习模型具有数量级更低的模型方差,说明在稀缺数据环境下,我们的多保真度训练策略能够产生具有较低期望误差的模型。