BriefGPT.xyz
Dec, 2023
多智能体强化学习的自适应参数共享
Adaptive parameter sharing for multi-agent reinforcement learning
HTML
PDF
Dapeng Li, Na Lou, Bin Zhang, Zhiwei Xu, Guoliang Fan
TL;DR
我们提出了一种新颖的参数共享方法,通过将每种类型的代理映射到共享网络中的不同区域,基于它们的身份,形成不同的子网络,从而增加了不同代理之间的策略多样性,而不引入额外的训练参数,通过在多个环境中进行的实验证明,我们的方法表现优于其他参数共享方法。
Abstract
parameter sharing
, as an important technique in
multi-agent systems
, can effectively solve the
scalability
issue in large-scale agent prob
→