有限深度求解不完全信息博弈
本文介绍了 DecisionHoldem,一种高级 AI,可通过安全深度限制子游戏解决来降低对手的可能手牌范围,以减少策略的可利用性,实验结果表明,DecisionHoldem 战胜了 heads-up no-limit Texas hold'em 扑克中最强的公开可用代理 Slumbot 和 Deepstack 的高水平繁殖,即 OpenStack,超过了 730 mbb/h 和 700mbb/h。此外,我们公开了 DecisionHoldem 的源代码和工具,以促进不完全信息游戏中的人工智能发展。
Jan, 2022
使用递归推理、分解和深度学习自主学习的一种直觉,结合理论支撑,DeepStack 算法用于处理不完全信息下的决策,并在 44000 手牌的实验中,在无限制德克萨斯扑克的头对头对决中,显著击败了职业扑克玩家,生成了更难被利用的策略。
Jan, 2017
介绍了在不完全信息博弈中如何使用子游戏求解技术,这些技术可以适应对手的行动并改善游戏过程中的解,被用于 Libratus,它是第一个在无限制德州扑克中击败顶级人类的 AI。
May, 2017
扑克是一种不完全信息游戏,本文比较了理论最优扑克与剥削式扑克,并讨论了抽象技术、投注模型和成功扑克机器人(如 Tartanian 和 Pluribus)所使用的具体策略;同时探讨了两人对战与多人对战游戏以及在与更多玩家对战时出现的限制;最后,本文讨论了机器学习和理论方法在开发获胜策略中的作用,并对这个快速发展领域的未来方向提出了建议。
Jan, 2024
本文介绍了一种快速计算两个玩家无限制德扑游戏规模的简单算法,提供了实现该算法并首次准确计算年度计算机扑克比赛的无限制德扑游戏状态、信息集、动作和终止节点数量的方法。
Feb, 2013
本文介绍了 ReBeL,它是一种通用的强化学习和搜索框架,并在任何两人零和博弈中证明收敛于纳什平衡。同时,使用比任何先前的扑克 AI 更少的领域知识,ReBeL 在无限制德州扑克中实现了超人类性能。
Jul, 2020
本文将 Descent 框架从完全信息的两人博弈扩展至随机博弈领域,并探讨了两种方法的实现和效果,其中 Descent 的泛化在 EinStein wurfelt nicht! 游戏中取得了最佳效果,而通过确定性游戏的近似仍然取得了良好的结果,可见其在特定场景下可能会取得更好的效果。
Feb, 2023