Dec, 2019

大规模深度强化学习下的 Dota 2

TL;DR2019 年 4 月 13 日,OpenAI Five 成为首个击败电子竞技游戏世界冠军的 AI 系统,通过对分布式训练和强化学习技术的不断完善,OpenAI Five 进行了 10 个月的自我训练,并证明了自我对战强化学习技术在困难任务上能够实现超人类表现。