BriefGPT.xyz
大模型
Ask
alpha
关键词
local value function
搜索结果 - 1
带有定向协调图的分布式合作多智能体强化学习
本文提出了一种分布式强化学习算法,该算法使用直接协调图和局部值函数,通过零阶优化方法进行条件估计,没有使用任何共识算法。与现有的基于零阶优化的强化学习算法相比,我们的算法保证了高可扩展性。
PDF
2 years ago
Prev
Next