Dec, 2023

多智能体强化学习中的协作课程学习

TL;DR在多智能体环境中,通过使用降低技能水平的协作队友为学习代理制定学习课程,能够同时实现任务完成与整体团队奖励最优。