BriefGPT.xyz
Ask
alpha
关键词
multi-agent policy distance
搜索结果 - 1
多智能体强化学习的策略距离测量
多样性在提高多智能体强化学习 (MARL) 性能方面起着关键作用,本文提出了一种通用的量化智能体政策差异的工具,多智能体政策距离 (MAPD),并通过在线部署设计了一个多智能体动态参数共享 (MADPS) 算法来应用该工具。实验证明,我们的
→
PDF
6 months ago
Prev
Next