BriefGPT.xyz
Ask
alpha
关键词
mara loss
搜索结果 - 1
通过奖励归因分解进行多智能体协作
本文提出了一种名为 Collaborative Q-learning (CollaQ) 的多智能体协作强化学习算法,它利用 Multi-Agent Reward Attribution (MARA) loss 进行训练并在 StarCraf
→
PDF
4 years ago
Prev
Next