Jun, 2022
重新思考符号回归数据集和基准,以促进科学发现
Rethinking Symbolic Regression Datasets and Benchmarks for Scientific
Discovery
TL;DR本研究重新审视了Symbolic Regression的数据集和评估标准,旨在探讨其在科学探索中的潜力。我们基于现有物理学讲义上的一组公式重建了120个数据集,为每个数据集设计了合理的取样范围,并提出使用标准化编辑距离作为评价指标。通过对五种最先进的SR方法和一种基于Transformer结构的简单基准线进行实验,结果表明我们提供了更现实的性能评估,并为开展基于机器学习的科学发现打开了新的思路。