Feb, 2025

因果均场多智能体强化学习

TL;DR本研究解决了多智能体强化学习中的可扩展性问题,提出了一种名为因果均场Q学习(CMFQ)的算法,通过引入结构因果模型来揭示决策过程中的因果关系,从而量化交互的重要性。研究表明,CMFQ在大规模智能体环境中表现出优异的可扩展性,具有显著的潜在影响。