BriefGPT.xyz
Nov, 2022
超越任务执行的评估:分析AlphaZero在Hex中的概念
Evaluation Beyond Task Performance: Analyzing Concepts in AlphaZero in Hex
HTML
PDF
Charles Lovering, Jessica Zosa Forde, George Konidaris, Ellie Pavlick, Michael L. Littman
TL;DR
使用自然语言处理中的两种评估技术,探究了AlphaZero在Hex游戏中的内部表示,研究发现MCTS在神经网络学习之前就发现了相关概念,而短期终局规划概念对应最终层,长期计划对应中间层。
Abstract
alphazero
, an approach to
reinforcement learning
that couples
neural networks
and
→