Feb, 2022

具有不完全信息的广义博弈的近最优学习

TL;DR本文提出两种新算法:平衡在线镜像下降和平衡对策后悔最小化,通过整合平衡探索策略到它们的经典对应物算法,解决学习不完美信息的广义零和游戏的近似 Nash 均衡问题。同时,将结果推广到学习多人游戏的粗略相关均衡。