关键词counterfactual regret minimization
搜索结果 - 23
- 针对展开式博弈的平滑理论与实践进展
本文主要研究如何通过改进膨胀熵函数的设计,加速第一阶段方法来解决 extensive-form games 问题,并提出了新的加权方案,实践证明本文方法比 CFR + 算法更快。
- 使用 CFR + 求解大规模不完全信息博弈
本文介绍了 CFR$^+$ 算法,它通常在计算时间上比以前已知算法快一个数量级或更多,同时可能需要更少的内存。该算法可用于不完美信息博弈中,是近似纳什均衡解的最佳方法之一。
- 具有不完全回忆的拓展形式博弈中的无悔学习
本文提出无法完全回忆的游戏中,针对使用 CFR 算法的一般类游戏的第一个遗憾上限及其不适用性,同时证明使用 CFR 在任何抽象类游戏中都适用,且在三种情况下证明不完全回忆可用于交换少量遗憾和显著降低内存。