Nov, 2023

使用特征文本化方法研究 BERT 神经元中单词的编码

TL;DR计算机视觉中可视化特征提供了一种将视觉模型的神经元信息分解解释的方法,我们的研究受到这一方法的启发并针对大型预训练语言模型进行了活化最大化的尝试;我们提出了特征文本化技术,用于提取预训练语言模型中神经元的知识表示,发现这些表示可以揭示关于神经元所编码的知识的见解,但神经元并不代表清晰的语言符号单元如词。