Feb, 2024

光谱滤波器、暗信号和注意力池

TL;DR将中间表示投影到词汇表是转换器模型 LLMs 的一种越来越流行的解释工具,我们提出了一种定量扩展方法,并基于将词汇表嵌入和未嵌入矩阵的奇异向量进行分组来定义中间表示的谱滤波器。通过保持注意力下沉,我们发现尽管部分抑制嵌入谱的大小,预训练模型的损失可以保持较低。最后,我们发现吸引许多标记的标记的表示在谱的尾部具有较大的投影。