Jul, 2023

具有状态不确定性的鲁棒多智能体强化学习

TL;DR在多智能体强化学习中,本研究首次尝试模拟带有状态不确定性的马尔科夫博弈问题,提出鲁棒性的解决方案,并设计了两种算法,RMAQ 和 RMAAC,用于处理高维状态 - 动作空间,在存在状态不确定性下,实验证明这两种算法在多智能体环境中表现出色。