Dec, 2023

可观察传播:揭示变压器中特征向量的高效数据方法

TL;DR本文介绍了一种称为 “ObservablePropagation” 的新方法,用于在计算给定任务时找到变压器语言模型使用的线性特征,具有很少的数据,结果表明 ObservablePropagation 在低数据范围内优于传统方法,可以更好地理解大型语言模型中的偏见机制。