May, 2018

我们在玩什么游戏?正常形式与广义形式博弈中的端到端学习

TL;DR本文提出一种基于可微分学习框架的扩展型博弈求解方法,包括一个求解量化应答均衡点的迭代算法和一个反向传播算法,该方法能够通过深度学习模型端到端地学习博弈模型,我们在多个博弈场景下进行了验证。