BriefGPT.xyz
Ask
alpha
关键词
differentiated strategies
搜索结果 - 1
多智能体强化学习的自适应参数共享
我们提出了一种新颖的参数共享方法,通过将每种类型的代理映射到共享网络中的不同区域,基于它们的身份,形成不同的子网络,从而增加了不同代理之间的策略多样性,而不引入额外的训练参数,通过在多个环境中进行的实验证明,我们的方法表现优于其他参数共享方
→
PDF
7 months ago
Prev
Next