BriefGPT.xyz
Ask
alpha
关键词
leader agent
搜索结果 - 1
在有向无环图约束下学习多个协同代理
本文提出了一种新的多智能体强化学习方法,旨在学习在有向无环图 (DAG) 约束条件下的多个协调智能体。我们的方法利用智能体之间的 DAG 结构,有效提高学习性能,并通过提出一种基于合成奖励的 MARL 模型的新型替代值函数来证明其作为最优值
→
PDF
a year ago
Prev
Next