May, 2021

具有熵正则化的竞争性游戏的快速策略外推方法

TL;DR本文研究了竞争性游戏的均衡计算问题,提出了一种通过熵正则化实现的解法,可以在线性速率下找到量子反应均衡,并且可以实现分散式迭代更新,同时还可以在亚线性速率下找到非正则矩阵博弈的纳什均衡和解决零和 MDP。