Feb, 2020

广义式博弈中随机后悔最小化

TL;DR本论文提出了一种新的用于开发随机后悔最小化方法的框架,该框架允许使用任何后悔最小化算法,结合任何梯度估算器,可以实例化几种新的随机方法来解决顺序游戏,并在三个游戏上展示了广泛的实验结果,其中一些方法的变体表现优于 MCCFR。