Oct, 2023

简化变压器中的线性潜模型:奥赛罗 GPT 的案例研究

TL;DR这篇论文通过细致的研究一个经过训练的简单变压器模型在奥赛罗游戏中的应用,扩展先前的研究以提升对奥赛罗 - GPT 应用中新兴世界模型的理解,揭示了奥赛罗 - GPT 所包含的对立棋子的线性表达,在决策过程中起着因果驱动作用,并进一步阐述了线性世界表达和因果决策之间的相互作用,以及它们对层深和模型复杂度的依赖关系。我们已将代码公开。