Sep, 2015

Poker-CNN:用于在扑克游戏中进行抽牌和下注的模式学习策略

TL;DR本文提出了一个基于统一表示的、具有模式匹配能力的扑克牌智能对手系统,系统通过迭代的自我博弈来学习游戏并改进水平,在三个扑克游戏中表现出色,并且比启发式程序表现出更好的竞争能力,本文的贡献在于:(1) 一种新的扑克游戏表示方法,可扩展到不同的扑克牌变种,(2) 一种基于 CNN 的学习模型,能够有效地学习三种不同游戏中的变化模式,和 (3) 一种通过自我训练显著超越启发式程序和在人类专家中具有竞争力的系统。