热力学信息量回归的引入 -- 一种用于热力学状态方程研发的工具
通过符号回归建模实现对实时航班排气温度与其他可测引擎参数之间的关系进行挖掘,从而达到既能保证模型准确性,又满足可解释性需求,最终实验结果表明该模型的误差为3°C,从工程学角度上看还是具有一定一致性的。
Mar, 2022
本研究重新审视了Symbolic Regression的数据集和评估标准,旨在探讨其在科学探索中的潜力。我们基于现有物理学讲义上的一组公式重建了120个数据集,为每个数据集设计了合理的取样范围,并提出使用标准化编辑距离作为评价指标。通过对五种最先进的SR方法和一种基于Transformer结构的简单基准线进行实验,结果表明我们提供了更现实的性能评估,并为开展基于机器学习的科学发现打开了新的思路。
Jun, 2022
提出了一种基于变压器(Transformer)的符号回归规划策略(TPSR),它融合了蒙特卡罗树搜索,允许将准确性和复杂性等非可微反馈信息整合到方程生成过程中,并且在多个数据集上进行的广泛实验表明,TPSR方法优于现有的方法。
Mar, 2023
ODEFormer是第一个能从单个解轨迹的观察中推断出符号形式的多维常微分方程(ODE)系统的transformer。它在两个数据集上进行了广泛的评估,并且在噪音和不规律采样观测方面显示出明显改进的性能和更快的推断速度。代码、模型和基准数据集已公开发布。
Oct, 2023
通过结合符号回归和离散外积计算,提出了一种从实验数据中自动发现物理模型的框架,该框架利用数学表达式构建可解释且易于分析的模型,有助于提高模型的泛化能力和减少符号表达式的搜索空间。并通过从合成实验数据中重新发现三个连续物理模型的方法,证明了方法的有效性。
Oct, 2023
本研究提出将符号回归作为特征工程步骤与机器学习模型结合,通过在合成和真实物理相关数据集上进行大量实验,实证了SR派生特征的融合显著提高了机器学习和深度学习回归模型的预测能力,合成数据集RMSE有34-86%的改进,真实数据集有4-11.5%的改进,同时还在基于Eliashberg理论的超导临界温度预测中取得了20%以上的RMSE改进,这些结果突出了SR作为数据驱动模型特征工程组件的潜力。
Nov, 2023
多视图符号回归(MvSR)方法考虑多个同时存在的数据集,以模拟实验环境并输出一个通用参数解,可以准确拟合所有数据集,能够恢复已知表达式并找到有前景的替代方案,从而使符号回归方法在广泛的实验场景下可用。
Feb, 2024
基于数据驱动的潜空间动力学识别方法通过嵌入热力学的第一和第二原理,利用自编码器作为非线性降维模型学习潜变量,并通过基于神经网络模型构建潜变量的动力学,遵循广义热动力学原理,从而产生了一种新的损失公式。潜编码器和潜动力学均通过最小化新损失进行训练,其泛化能力强,即使在外推情况下也表现出鲁棒性。此外,实证观察到潜空间中熵产生速率与完全状态解的行为之间存在着有趣的相关性。
Mar, 2024
利用贝叶斯神经网络和自编码器来降低状态空间的维度,将知识从源域传递到目标域,该新颖的概率迁移学习框架在低维度和稀疏数据情境下能够正确预测热化学状态,并且比现有的确定性迁移学习策略所需的数据量少四倍。
May, 2024