Apr, 2022

自然语言标注下的游戏代理理解

TL;DR通过一份新的包含 10000 个人工注释的围棋游戏数据集,我们展示了自然语言注释如何作为一种工具用于模型可解释性,并利用线性探测从围棋游戏代理中间状态的表示中预测特定于领域的术语,并发现这些游戏概念被编码在两个不同的策略网络中。