关键词policy space response oracle
搜索结果 - 2
- 融合 - PSRO:策略空间响应预言的纳什策略融合
为了解决非传递性的零和游戏问题,该研究提出了一种名为 Fusion-PSRO 的方法,通过模型融合初始化策略,以更好逼近最佳反应策略,并在非传递性矩阵游戏和复杂 Liars Dice 等实验中验证了其在提高几乎所有 PSRO 变体性能方面的 - 高效的策略空间响应预测
该研究提出了 Efficient PSRO 方法来解决传统 Policy Space Response Oracle 方法中存在的计算和探索效率低的问题,通过引入 no-regret optimization 和 parallelizati