Nov, 2024

正规形式博弈中后悔最小化的计算下界

TL;DR本研究探讨了在正规形式博弈中,缩小后悔的迭代次数以达到相关均衡(CE)的问题。作者提出了现有学习算法(如乘法权重更新)接近最优的证据,并证明了计算均匀混合的T个产品分布的CE的下界,这些结果为基于算法的后悔最小化方案提供了重要限制,可能影响相关算法的设计与优化。