Dec, 2023
可观察传播:揭示变压器中特征向量的高效数据方法
Observable Propagation: A Data-Efficient Approach to Uncover Feature Vectors in Transformers
Jacob Dunefsky, Arman Cohan
TL;DR本文介绍了一种称为 “ObservablePropagation” 的新方法,用于在计算给定任务时找到变压器语言模型使用的线性特征,具有很少的数据,结果表明 ObservablePropagation 在低数据范围内优于传统方法,可以更好地理解大型语言模型中的偏见机制。