Mar, 2024

政策空间响应预测:一项调查

TL;DR在游戏理论中,一个游戏指的是理性决策者或玩家之间相互作用的模型,他们通过选择来实现各自的目标。本文简要概述了一种快速发展的用于大型游戏的游戏推理框架 —— 策略空间响应预言机(PSRO)。我们首先阐述了引入 PSRO 的动机,并提供了历史背景和将其置于游戏推理方法中的位置。然后,我们重点讨论了 PSRO 中的策略探索问题,即在最小计算成本下构建一个有效的策略组合来建模潜在游戏的挑战。我们还总结了当前提高 PSRO 效率的研究方向,并探讨了 PSRO 在不同领域的应用。最后,我们讨论了未来研究的开放问题。