BriefGPT.xyz
Ask
alpha
关键词
starcraft ii micromanagement
搜索结果 - 1
AAAI
价值分解的多智能体演员 - 评论家模型
在多智能体强化学习中,QMIX 使用非负函数逼近器表示联合动作价值,并在 StarCraft II 微观管理任务中取得了迄今最好的性能。然而,我们的实验表明,在某些情况下,QMIX 与 A2C 不兼容。为了在培训效率和算法性能之间获得合理的
→
PDF
4 years ago
Prev
Next