BriefGPT.xyz
Ask
alpha
关键词
multi-agent markov decision processes
搜索结果 - 1
$QD$-Learning: 一种多智能体强化学习的合作式分布式策略,通过共识 + 创新实现
该论文研究了一类多智能体马尔可夫决策过程,在其中,网络代理对全局可控状态和远程控制器的控制行为有不同的响应。在没有全局状态转移和本地代理成本统计信息之前,论文探讨了一种分布式强化学习设置,并提出了一种分布式版本的 Q-learning 方法
→
PDF
12 years ago
Prev
Next