Dec, 2022
E-MAPP: 高效的并行程序指导多智能体强化学习
E-MAPP: Efficient Multi-Agent Reinforcement Learning with Parallel
Program Guidance
TL;DR通过使用并行程序指导多个智能体高效完成需要规划 10 个以上阶段的任务,本文提出了一种名为 E-MAPP 的增强型多智能体强化学习框架,该框架整合了程序的结构信息,促进了基于程序语义的协作行为,并通过任务分配器提高了时间效率,在 Overcooked 环境中完成的一系列复杂的长期合作任务的实验结果表明, E-MAPP 在完成率、时间效率和零-shot 泛化能力方面优于强基线方法。