BriefGPT.xyz
Ask
alpha
关键词
dynamic programming problems
搜索结果 - 1
多智能体展开算法与强化学习
本文介绍了一种基于本地回滚算法的多智能体决策方法,该方法通过配合其他智能体的协调信息,在每个阶段使每个智能体的决策都能够独立计算,并且与智能体数量无关。此外,我们探讨了并行化智能体计算和近似策略迭代算法等方法来进一步提高本方法的计算效率,并
→
PDF
5 years ago
Prev
Next