Jan, 2022

DecisionHoldem: 不完全信息游戏的安全深度限制求解与多样对手

TL;DR本文介绍了 DecisionHoldem,一种高级 AI,可通过安全深度限制子游戏解决来降低对手的可能手牌范围,以减少策略的可利用性,实验结果表明,DecisionHoldem 战胜了 heads-up no-limit Texas hold'em 扑克中最强的公开可用代理 Slumbot 和 Deepstack 的高水平繁殖,即 OpenStack,超过了 730 mbb/h 和 700mbb/h。此外,我们公开了 DecisionHoldem 的源代码和工具,以促进不完全信息游戏中的人工智能发展。