Oct, 2019
扩张式形式博弈中的扩张距离产生函数乐观遗憾最小化
Optimistic Regret Minimization for Extensive-Form Games via Dilated
Distance-Generating Functions
TL;DR研究了在广泛形式博弈中最小化后悔和计算纳什均衡的乐观后悔最小化算法的性能,研究了扩展形式游戏距离生成函数的使用,证明了扩展欧几里德距离函数具有广义树片段的强凸性参数的第一个显式边界,提出了一种乐观算法可以优化计算效率,这在最小化后悔而不是计算纳什均衡时表现出很好的结果。