May, 2024

5*5 多人围棋的深度强化学习

TL;DR使用搜索算法和深度强化学习,本文提出并分析了使用 AlphaZero 和 Descent 算法自动学习多人版围棋。进一步展示了搜索算法和深度强化学习提高了棋局水平的结果。