BriefGPT.xyz
Ask
alpha
关键词
texas hold'em
搜索结果 - 3
PokerGPT: 通过大型语言模型的端到端轻量级解决方案,用于多人德州扑克
PokerGPT 使用增强学习人类反馈技术,通过将真实游戏记录转化为提示信息,将 LM 模型细化,从而解决了德州扑克等不完全信息游戏中的问题,在获胜率、模型大小、训练时间和响应速度等方面优于之前的方法。
PDF
6 months ago
DecisionHoldem: 不完全信息游戏的安全深度限制求解与多样对手
本文介绍了 DecisionHoldem,一种高级 AI,可通过安全深度限制子游戏解决来降低对手的可能手牌范围,以减少策略的可利用性,实验结果表明,DecisionHoldem 战胜了 heads-up no-limit Texas hol
→
PDF
2 years ago
贝叶斯的博弈策略:扑克中的对手建模
本论文提出了一种基于贝叶斯概率模型的智能扑克方法,通过分离游戏动力学和对手策略的不确定性,采用狄利克雷先验测试了对手的策略概率,对于对手的后验分布提出有效的对策,该方法在德克萨斯 Hold'em 中得到了应用。
PDF
12 years ago
Prev
Next