Jul, 2023

具有状态不确定性的鲁棒多智能体强化学习

TL;DR在多智能体强化学习中,本研究首次尝试模拟带有状态不确定性的马尔科夫博弈问题,提出鲁棒性的解决方案,并设计了两种算法,RMAQ和RMAAC,用于处理高维状态-动作空间,在存在状态不确定性下,实验证明这两种算法在多智能体环境中表现出色。