Jan, 2024

DeLF: 使用基础模型设计学习环境

TL;DR通过使用大语言模型设计和编码用户预期的学习场景,我们提出了一种名为DeLF的方法,用于设计强化学习环境的组件,以解决在实践中应用RL在许多简单应用中仍然困难的问题。我们通过在四个不同的学习环境上测试我们的方法,证明DeLF能够为相应的RL问题获得可执行的环境代码。