Jul, 2015

通用和随机游戏的梯度下降方案研究

TL;DR本文研究一种梯度方案对两个玩家的随机博弈进行求解,并在模拟中显示该方案确实收敛到 Nash 均衡解。但如果只在目标函数的全局最小值处才能达到最优解,当渐近接近时仅能到达局部极小值,本文阐明了梯度方案收敛于广义和随机游戏中纳什均衡的重要必要条件。