Jun, 2022

重新思考符号回归数据集和基准,以促进科学发现

TL;DR本研究重新审视了 Symbolic Regression 的数据集和评估标准,旨在探讨其在科学探索中的潜力。我们基于现有物理学讲义上的一组公式重建了 120 个数据集,为每个数据集设计了合理的取样范围,并提出使用标准化编辑距离作为评价指标。通过对五种最先进的 SR 方法和一种基于 Transformer 结构的简单基准线进行实验,结果表明我们提供了更现实的性能评估,并为开展基于机器学习的科学发现打开了新的思路。