Aug, 2022

具有动态参与智能体的可转移的多智能体强化学习

TL;DR本研究提出一种具有 Few-shot Learning 算法的网络架构,允许在集中式训练期间代理的数量变化,这可以使新代理的模型适应速度比基线模型快 100 多倍。