Feb, 2022

利用深度强化学习构建一款 3 人麻将人工智能

TL;DR本文介绍 Meowjong,这是一款使用深度强化学习技术的三人日本麻将 Sanma 制作的 AI。作者定义了一种紧凑而信息丰富的二维数据结构,用于编码 Sanma 游戏中可观察到的信息,并使用卷积神经网络对 Sanma 的动作进行预训练,并通过自我对弈增强了主要动作模型的性能,最终取得了在 Sanma 游戏中的领先地位。