Oct, 2023

基于图分块模型的图零游戏的强化学习方法与重采样

TL;DR多人群平均场博弈模型的研究中,利用均场近似可以找到纳什均衡,在实际应用中,由于普适假设的限制,我们提出了一种基于图纹重抽样的学习框架,用于捕捉智能体连接的复杂网络结构,并通过分析其动力学与多人群平均场博弈动力学之间的收敛关系,提出了一种高效的基于样本的多智能体强化学习算法,而无需进行群体操作,并对其收敛性进行了严格的有限样本保证分析。