具有不完全回忆的拓展形式博弈中的无悔学习

May, 2012

No-Regret Learning in Extensive-Form Games with Imperfect Recall

Marc Lanctot, Richard Gibson, Neil Burch, Martin Zinkevich, Michael Bowling

TL;DR本文提出无法完全回忆的游戏中，针对使用 CFR 算法的一般类游戏的第一个遗憾上限及其不适用性，同时证明使用 CFR 在任何抽象类游戏中都适用，且在三种情况下证明不完全回忆可用于交换少量遗憾和显著降低内存。

Abstract

counterfactual regret minimization (CFR) is an efficient no-regret learning algorithm for decision problems modeled as extensive games. CFR's reg