Apr, 2024

基于生成预训练 Transformer 的符号回归与上下文强化学习

TL;DR本文提出了 FormulaGPT,通过使用基于强化学习的 SR 算法的大规模稀疏奖励学习历史作为训练数据进行 GPT 训练,将基于强化学习的 SR 算法提炼为一种 Transformer。在多个数据集上进行测试,FormulaGPT 在拟合能力方面表现出与四个基准模型相比的最先进性能,并且在噪声鲁棒性、多功能性和推理效率方面均取得了令人满意的结果。