科学符号推理的概率正则树先验
本文提出了一种新的基于贝叶斯的符号回归 (SR) 方法,通过添加先验知识,控制复杂度,并利用马尔可夫链蒙特卡罗方法从后验分布中采样符号树,从而提高 SR 模型的可解释性和准确性。与遗传编程相比,该方法更节省计算机内存。
Oct, 2019
提出了一种基于变压器(Transformer)的符号回归规划策略(TPSR),它融合了蒙特卡罗树搜索,允许将准确性和复杂性等非可微反馈信息整合到方程生成过程中,并且在多个数据集上进行的广泛实验表明,TPSR 方法优于现有的方法。
Mar, 2023
本研究重新审视了 Symbolic Regression 的数据集和评估标准,旨在探讨其在科学探索中的潜力。我们基于现有物理学讲义上的一组公式重建了 120 个数据集,为每个数据集设计了合理的取样范围,并提出使用标准化编辑距离作为评价指标。通过对五种最先进的 SR 方法和一种基于 Transformer 结构的简单基准线进行实验,结果表明我们提供了更现实的性能评估,并为开展基于机器学习的科学发现打开了新的思路。
Jun, 2022
这篇研究论文介绍了一种新的 Transformer 模型,用于符号回归(Symbolic Regression)特别关注其在科学发现领域的应用。我们提出了三种不断增加灵活性的编码器架构,但代价是列置换等变性的破坏。训练结果表明,最灵活的架构能够防止过拟合。经过训练后,我们应用最佳模型到符号回归科学发现数据集(SRSD 数据集),使用归一化的基于树的编辑距离获得了最新的结果,而且不需要额外的计算成本。
Dec, 2023
提出了一种新的增强符号回归机 (RSRM) 模型,通过 Monte Carlo 树搜索、双 Q-learning 块和调制子树发现块,可以从极少的数据中学习复杂的数学方程,并取得了关于符号回归的最新性能记录。
May, 2023
本研究提出了一种通过计算机视觉构建符号表达式变换器来解决基于样本的符号回归模型的通用性和效率受限的问题,并在一个不重复数据集上进行了测试。
May, 2022
本文提出了一种基于强化学习的语法引导符号回归方法,利用上下文无关文法作为强化行动空间来限制表示空间,并且针对物理方程搜索的应用场景,与基于文法和非基于文法的符号回归方法进行比较。实验结果表明,我们的方法在基准测试中具有竞争力,并在误差 - 复杂度权衡方面提供了最佳表现,突出了在实际情况下使用基于文法的方法的优点。
Feb, 2022
在函数分析的新视角下,我们提出了一种名为傅里叶树生长(FTG)的新颖符号回归方法,以解决遗传编程在树状表示用于符号回归时的性能限制问题,并在经典一维基准问题上取得了显著的性能改进,同时揭示了遗传编程在符号回归问题上的局限,并为进一步推动符号回归和可解释机器学习相关领域的发展指明了方向。
Feb, 2024