Dec, 2022

大规模完全信息博弈中求解领导者-追随者均衡的函数逼近

TL;DR本研究提出了一种基于神经网络的函数近似方法,应用于广义和博弈的Stackelberg博弈情景,以学习Enforceable Payoff Frontier,从而实现对博弈策略的近似计算和评估。