Feb, 2023

面向多智体强化学习的熟练人口课程

TL;DR该论文介绍了一种名为SPC的新型自动课程学习框架,该框架将课程学习应用于多智能体协调中,通过赋予学生团体不变的通信和分层技能,在不同数量的代理任务中学习合作和行为技能,并在学生策略的条件下将老师建模为一个情境式赌博机,提高了MARL环境下的性能、可伸缩性和样本效率。