ICLRFeb, 2023

面向人群大小的平均场博弈策略优化

TL;DR本文提出了一种名为 PAPO 的方法,通过结合增强和超网络的方式,在同时考虑人口数量和生成策略的前提下,进行不同人口数量游戏的策略优化,并在多个环境中进行了实验和分析,验证了该方法在群体博弈中取得了非常显著的优越性。