AAAIFeb, 2019

加速围棋自我博弈学习

TL;DR通过改进 AlphaZero 的过程和架构,我们在 Go 中极大地加速了自我博弈学习,与类似方法相比,计算量减少了 50 倍。