AAAIFeb, 2019

ELF Mini-RTS 上的神经虚构自我对弈

TL;DR本研究通过应用神经虚拟自我博弈(Neural Fictitious Self-Play,NFSP)和策略梯度强化学习方法,实现了在小型 RTS 游戏上寻找纳什均衡的目标,并且通过预先使用策略梯度自我博弈来预训练模型,成功提高 NFSP 的可扩展性。