Nov, 2022
超越任务执行的评估:分析 AlphaZero 在 Hex 中的概念
Evaluation Beyond Task Performance: Analyzing Concepts in AlphaZero in Hex
Charles Lovering, Jessica Zosa Forde, George Konidaris, Ellie Pavlick, Michael L. Littman
TL;DR使用自然语言处理中的两种评估技术,探究了 AlphaZero 在 Hex 游戏中的内部表示,研究发现 MCTS 在神经网络学习之前就发现了相关概念,而短期终局规划概念对应最终层,长期计划对应中间层。