AAAINov, 2018

使用深度强化学习的星际争霸 II 模块化架构

TL;DR本研究提出了一种新颖的 StarCraft II AI 模块化架构,其通过分配不同的模块控制游戏的不同方面(例如选址和策略),实现了独立或联合优化,并采用深度强化学习技术,通过自我对战进行训练,对六个模块中的两个模块进行训练,以 94%或 87%的胜率在 Zerg vs.Zerg 比赛中击败了 “Harder (5 级)”Blizzard bot,具有适用性及实用价值。