Mar, 2022

培养一位成功的炸弹超人代理

TL;DR本文研究了基于不同搜索算法(蒙特卡罗树搜索、滚动视野进化和 Beam 搜索)的 AI 策略,以成功玩出 CodinGame 平台上的 Bomberman 变体游戏,并提出各种强化方法。我们的最高水平变异体基于 Beam 搜索,并实现了在状态表示和估价函数上的优化,以及基于模拟估计存活率来修剪掉不良状态。这一方法已经成功在 CodinGame 竞技场中超越了 2,300 个其他 AI 对手。