Apr, 2024

多智能体强化学习的可证明高效信息导向采样算法

TL;DR该研究设计和分析了一组基于信息导向采样(IDS)原则的新型多智能体强化学习(MARL)算法,这些算法受到信息论基础概念的启发,在两人零和马尔可夫博弈和多人一般和博弈等MARL环境中被证明具有高样本效率。