Feb, 2024

RL-GPT: 集成强化学习和代码为策略

TL;DR利用两级分层框架 RL-GTP,在具备高效能 coding 能力的慢速代理和执行编码任务的快速代理之间无缝融合,以高效地处理涉及复杂逻辑和精确控制的实体任务,并取得了在 Minecraft 游戏中以及指定的 MineDojo 任务上的优越表现。