Dec, 2023

用均值居中改进语言模型中的激活引导

TL;DR通过应用均值中心化的思想,我们发现将与目标数据集相关的激活平均值减去所有训练激活的均值,可以得到有效的转向向量,这在广泛的上下文中可以轻松改善激活转向的有效性。