Jun, 2023

全局状态预测的分布式多智能体强化学习

TL;DR本文探讨了应用深度强化学习(Deep reinforcement learning, DRL)到机器人群体控制中的挑战,并提出了一种基于部分可观察马尔科夫决策过程(Partially Observable Markov Decision Process, POMDP)的解决方案,通过比较几个深度强化学习算法的表现,证明了全局状态预测(Global State Prediction, GSP)可以提高性能和鲁棒性。