科学符号推理的概率正则树先验

Jun, 2023

Probabilistic Regular Tree Priors for Scientific Symbolic Reasoning

Tim Schneider, Amin Totounferoush, Wolfgang Nowak, Steffen Staab

TL;DR该研究采用概率正则树表达式 (pRTE) 紧凑表达领域专家对科学方程的先验信念，并采用贝叶斯推理将其提供给以有限状态机编码的符号回归，以有效提高其搜索效率和性能。

Abstract

symbolic regression (SR) allows for the discovery of scientific equations from data. To limit the large search space of possible equations, prior knowledge has been expressed in terms of →

symbolic regression formal grammars bayesian inference prte scientific equations

发现论文，激发创造

符号回归的先验知识

该研究论文提出一种基于 n-gram 语言模型和分数贝叶斯因子的符号回归（SR）的先验信息方法，并将其性能与文献标准以及天文学领域中的基准测试结果进行了比较。

Apr, 2023

贝叶斯符号回归

本文提出了一种新的基于贝叶斯的符号回归 (SR) 方法，通过添加先验知识，控制复杂度，并利用马尔可夫链蒙特卡罗方法从后验分布中采样符号树，从而提高 SR 模型的可解释性和准确性。与遗传编程相比，该方法更节省计算机内存。

Oct, 2019

深度生成符号回归

通过利用预训练的深度生成模型来捕捉方程的内在规律，本研究提出了深度生成符号回归（DGSR）框架，实现了具有更高恢复率和更高计算效率的符号回归解决方案。

Dec, 2023

基于 Transformer 的符号回归规划

提出了一种基于变压器（Transformer）的符号回归规划策略（TPSR），它融合了蒙特卡罗树搜索，允许将准确性和复杂性等非可微反馈信息整合到方程生成过程中，并且在多个数据集上进行的广泛实验表明，TPSR 方法优于现有的方法。

Mar, 2023

重新思考符号回归数据集和基准，以促进科学发现

本研究重新审视了 Symbolic Regression 的数据集和评估标准，旨在探讨其在科学探索中的潜力。我们基于现有物理学讲义上的一组公式重建了 120 个数据集，为每个数据集设计了合理的取样范围，并提出使用标准化编辑距离作为评价指标。通过对五种最先进的 SR 方法和一种基于 Transformer 结构的简单基准线进行实验，结果表明我们提供了更现实的性能评估，并为开展基于机器学习的科学发现打开了新的思路。

Jun, 2022

用于科学发现的符号回归的 Transformer 模型

这篇研究论文介绍了一种新的 Transformer 模型，用于符号回归（Symbolic Regression）特别关注其在科学发现领域的应用。我们提出了三种不断增加灵活性的编码器架构，但代价是列置换等变性的破坏。训练结果表明，最灵活的架构能够防止过拟合。经过训练后，我们应用最佳模型到符号回归科学发现数据集（SRSD 数据集），使用归一化的基于树的编辑距离获得了最新的结果，而且不需要额外的计算成本。

Dec, 2023

RSRM: 强化符号回归机

提出了一种新的增强符号回归机 (RSRM) 模型，通过 Monte Carlo 树搜索、双 Q-learning 块和调制子树发现块，可以从极少的数据中学习复杂的数学方程，并取得了关于符号回归的最新性能记录。

May, 2023

符号表达式转换器：一种用于符号回归的计算机视觉方法

本研究提出了一种通过计算机视觉构建符号表达式变换器来解决基于样本的符号回归模型的通用性和效率受限的问题，并在一个不重复数据集上进行了测试。

May, 2022

利用语法引导符号回归的强化学习方法实现领域知识融合

本文提出了一种基于强化学习的语法引导符号回归方法，利用上下文无关文法作为强化行动空间来限制表示空间，并且针对物理方程搜索的应用场景，与基于文法和非基于文法的符号回归方法进行比较。实验结果表明，我们的方法在基准测试中具有竞争力，并在误差 - 复杂度权衡方面提供了最佳表现，突出了在实际情况下使用基于文法的方法的优点。

Feb, 2022

符号回归的函数分析方法

在函数分析的新视角下，我们提出了一种名为傅里叶树生长（FTG）的新颖符号回归方法，以解决遗传编程在树状表示用于符号回归时的性能限制问题，并在经典一维基准问题上取得了显著的性能改进，同时揭示了遗传编程在符号回归问题上的局限，并为进一步推动符号回归和可解释机器学习相关领域的发展指明了方向。

Feb, 2024