Oct, 2023

SDGym: 使用系统动力学模型的低代码强化学习环境

TL;DR通过引入系统动态方法(SD)作为一种补充方法,利用 SDGym 生成基于 SD 模拟模型的定制强化学习(RL)环境,验证了通过预先存在的 SD 模型和少量的配置代码可以生成良好指定、丰富的 RL 环境。