Sep, 2024

一般和博弈中的去中心化学习

TL;DR本研究针对在动态和不确定的社会系统中,多代理间异质效用交互的去中心化学习算法设计与分析存在的空白,提出一种基于马尔可夫近势函数(MNPF)的新方法,以保证算法能够收敛到近似纳什均衡。研究表明,该方法能有效应对多代理系统中的学习收敛问题,并提供新的视角来分析去中心化算法的设计。