AAAIDec, 2023

通用游戏求解的快速且无需专业知识的深度学习

TL;DR我们开发了一种将 AlphaZero 模型适应于通用游戏对战(GGP)的方法,该方法侧重于更快的模型生成并且需要从游戏规则中提取的知识更少。数据集生成使用 MCTS 进行游戏对战,只使用值网络,并且使用注意力层替换卷积层。我们在 Regular Boardgames GGP 系统中实施了这种方法,并展示了我们可以高效地构建优于 UCT 基准的模型。