Dec, 2023

多智能体强化学习的自适应参数共享

TL;DR我们提出了一种新颖的参数共享方法,通过将每种类型的代理映射到共享网络中的不同区域,基于它们的身份,形成不同的子网络,从而增加了不同代理之间的策略多样性,而不引入额外的训练参数,通过在多个环境中进行的实验证明,我们的方法表现优于其他参数共享方法。