本文提出了一种通过生成 player 模型,利用叫做 procedual personas 的原型 player 模型实现自动游戏内容测试的方法,该模型基于心理决策理论,通过使用进化计算开发的节点选择标准来替换 MCTS 的标准 UCB1 标准。我们在多种游戏水平中演示了这些人物的应用,并展示了不同的玩法风格如何在每个水平中表现。总之,我们使用人工智能人物来构建合成游戏测试人员。该方法可用作自动游戏测试工具,在人类反馈不可用或需要快速可视化潜在互动时使用。可能的应用包括游戏开发期间的交互式工具或需在短时间内进行许多评估的程序性内容生成系统。
本文主要介绍在计算机游戏中使用的 Monte Carlo Tree Search 算法中的采样策略 —— naive sampling,结合 Combinatorial Multi-armed Bandits 问题进行分析和比较,并在实时策略游戏中进行了验证。实验结果表明,在分支因子增加的情况下,naive sampling 比其他采样策略更有效。