Dec, 2019
大规模深度强化学习下的 Dota 2
Dota 2 with Large Scale Deep Reinforcement Learning
OpenAI, Christopher Berner, Greg Brockman, Brooke Chan, Vicki Cheung...
TL;DR2019 年 4 月 13 日,OpenAI Five 成为首个击败电子竞技游戏世界冠军的 AI 系统,通过对分布式训练和强化学习技术的不断完善,OpenAI Five 进行了 10 个月的自我训练,并证明了自我对战强化学习技术在困难任务上能够实现超人类表现。