有限深度求解不完全信息博弈

May, 2018

Depth-Limited Solving for Imperfect-Information Games

Noam Brown, Tuomas Sandholm, Brandon Amos

TL;DR该篇论文提出了一种通过让对手在深度限制处选择多个策略之一来在不完美信息游戏中进行有原则的深度限制求解的方法，证明了这种方法的有效性，并建立了一个仅使用 4 核 CPU 和 16GB 内存就可以击败之前的两个顶级代理的大师级德州扑克 AI。

Abstract

A fundamental challenge in imperfect-information games is that states do not have well-defined values. As a result, depth-limited search algorithms used in single-agent settings and perfect-information games do not apply. This paper introduces a principled way to conduct →

imperfect-information games depth-limited solving strategies texas hold'em poker ai opponent

发现论文，激发创造

DecisionHoldem: 不完全信息游戏的安全深度限制求解与多样对手

本文介绍了 DecisionHoldem，一种高级 AI，可通过安全深度限制子游戏解决来降低对手的可能手牌范围，以减少策略的可利用性，实验结果表明，DecisionHoldem 战胜了 heads-up no-limit Texas hold'em 扑克中最强的公开可用代理 Slumbot 和 Deepstack 的高水平繁殖，即 OpenStack，超过了 730 mbb/h 和 700mbb/h。此外，我们公开了 DecisionHoldem 的源代码和工具，以促进不完全信息游戏中的人工智能发展。

Jan, 2022

DeepStack: 无限制德州扑克中的专家级人工智能

使用递归推理、分解和深度学习自主学习的一种直觉，结合理论支撑，DeepStack 算法用于处理不完全信息下的决策，并在 44000 手牌的实验中，在无限制德克萨斯扑克的头对头对决中，显著击败了职业扑克玩家，生成了更难被利用的策略。

Jan, 2017

不完全信息博弈中的历史过滤：算法与复杂度

我们介绍和分析了子游戏分解中过滤历史的计算方面和可处理性，揭示了深度有限搜索通过子游戏分解在不完全信息环境下进行顺序决策的时机和方式。

Nov, 2023

不完美信息博弈中的安全和嵌套子游戏求解

介绍了在不完全信息博弈中如何使用子游戏求解技术，这些技术可以适应对手的行动并改善游戏过程中的解，被用于 Libratus，它是第一个在无限制德州扑克中击败顶级人类的 AI。

May, 2017

关于博弈论最优扑克的调查

扑克是一种不完全信息游戏，本文比较了理论最优扑克与剥削式扑克，并讨论了抽象技术、投注模型和成功扑克机器人（如 Tartanian 和 Pluribus）所使用的具体策略；同时探讨了两人对战与多人对战游戏以及在与更多玩家对战时出现的限制；最后，本文讨论了机器学习和理论方法在开发获胜策略中的作用，并对这个快速发展领域的未来方向提出了建议。

Jan, 2024

测量大型无限制扑克游戏的规模

本文介绍了一种快速计算两个玩家无限制德扑游戏规模的简单算法，提供了实现该算法并首次准确计算年度计算机扑克比赛的无限制德扑游戏状态、信息集、动作和终止节点数量的方法。

Feb, 2013

基于深度强化学习和搜索算法的不完全信息博弈组合

本文介绍了 ReBeL，它是一种通用的强化学习和搜索框架，并在任何两人零和博弈中证明收敛于纳什平衡。同时，使用比任何先前的扑克 AI 更少的领域知识，ReBeL 在无限制德州扑克中实现了超人类性能。

Jul, 2020

学习在没有知识的情况下玩随机完全信息双人游戏

本文将 Descent 框架从完全信息的两人博弈扩展至随机博弈领域，并探讨了两种方法的实现和效果，其中 Descent 的泛化在 EinStein wurfelt nicht! 游戏中取得了最佳效果，而通过确定性游戏的近似仍然取得了良好的结果，可见其在特定场景下可能会取得更好的效果。

Feb, 2023

使用分解法解决不完全信息博弈

介绍了第一种将不完美信息博弈分解为可独立求解的子游戏的技术，并实现了保证最优解的全局博弈解决算法和可生成大于可用存储空间的纳什均衡的离线博弈求解算法。

Mar, 2013

多人不完美信息博弈中的贝叶斯对手建模

本研究探讨了面对多个对手的策略交互游戏，使用对手建模和观察对手策略等技术，超越纯理性策略的表现。

Dec, 2022