BriefGPT.xyz
May, 2012
具有不完全回忆的拓展形式博弈中的无悔学习
No-Regret Learning in Extensive-Form Games with Imperfect Recall
HTML
PDF
Marc Lanctot, Richard Gibson, Neil Burch, Martin Zinkevich, Michael Bowling
TL;DR
本文提出无法完全回忆的游戏中,针对使用 CFR 算法的一般类游戏的第一个遗憾上限及其不适用性,同时证明使用 CFR 在任何抽象类游戏中都适用,且在三种情况下证明不完全回忆可用于交换少量遗憾和显著降低内存。
Abstract
counterfactual regret minimization
(CFR) is an efficient no-regret learning algorithm for decision problems modeled as
extensive games
. CFR's
reg
→