BriefGPT.xyz
Ask
alpha
关键词
closed-loop policies
搜索结果 - 1
SMACv2:用于协作多智能体强化学习的改进基准
通过引入新版本的基准测试 SMACv2,可以解决 SMAC 不足的问题并促进多智能体强化学习 (MARL) 算法的发展。
PDF
2 years ago
Prev
Next