Jan, 2025

可解释的强化学习在一级方程式比赛策略中的应用

TL;DR本文针对一级方程式赛车比赛策略的优化问题,引入了一种新的强化学习模型RSRL(赛车策略强化学习),提供了一种比传统硬编码和基于蒙特卡洛的策略更快速的替代方案。研究表明,RSRL在2023年巴林大奖赛中实现了平均名次P5.33,优于最佳基线P5.63,并通过特征重要性和决策树模型增强了模型的可解释性和用户信任度。