May, 2024

融合 - PSRO:策略空间响应预言的纳什策略融合

TL;DR为了解决非传递性的零和游戏问题,该研究提出了一种名为 Fusion-PSRO 的方法,通过模型融合初始化策略,以更好逼近最佳反应策略,并在非传递性矩阵游戏和复杂 Liars Dice 等实验中验证了其在提高几乎所有 PSRO 变体性能方面的有效性。