May, 2025
通过状态建模和对抗性探索增强合作多智能体强化学习
Enhancing Cooperative Multi-Agent Reinforcement Learning with State
Modelling and Adversarial Exploration
Andreas Kontogiannis, Konstantinos Papathanasiou, Yi Shen, Giorgos Stamou, Michael M. Zavlanos...
TL;DR本研究解决了多智能体深度强化学习中,分布式部分可观察环境下缺乏通信能力所带来的合作学习挑战。提出了一种新颖的状态建模框架,帮助智能体通过推断非可观察状态的信念表征来优化其探索和合作执行策略。实验结果表明,所提出的MARL SMPE算法在多个复杂完全合作任务中超越了现有的最先进的MARL算法。