AAAIDec, 2019

使用深度强化学习掌握 MOBA 游戏中的复杂控制

TL;DR本文提出了一种深度强化学习框架,从系统和算法两个角度来解决 Multi-player Online Battle Arena(MOBA)1v1 游戏中复杂动作控制的问题,通过包括控制依赖解耦、动作遮罩、目标注意力和双剪辑 PPO 等多种新颖策略,训练出可以在 MOBA 游戏王者荣耀中打败顶级人类选手的 AI 代理 Tencent Solo。