Mar, 2025

基于邻域的因素化多智能体演员-评论家算法的多机器人协调学习

TL;DR本研究解决了现有多智能体强化学习算法在去中心化系统中对个体机器人动作影响评估不准确的问题。提出的Loc-FACMAC算法通过在评论学习中引入邻域概念,在训练过程中形成相关机器人的分区,从而改善策略评估的精准度。实验结果表明,当邻域结构设计得当时,Loc-FACMAC在多个环境中的性能显著优于现有基线算法,提升幅度可达108%。