Nov, 2023

线性表示假设与大语言模型的几何性质

TL;DR用因果内积统一各种线性表示概念,通过使用反事实对实验表明线性表示概念的存在,与解释和控制的连接以及内积选择的基本作用。