Nov, 2023
稀疏化再分类:从大型语言模型的内部神经元到高效的文本分类器
Sparsify-then-Classify: From Internal Neurons of Large Language Models
To Efficient Text Classifiers
TL;DR我们的研究提出了一种使用所有内部表示的方法,通过在所有激活和隐藏状态上采用多种池化策略,首先逐层稀疏化特定于任务的特征,然后在层之间进行聚合,用于文本分类。我们的实验证明,STC不仅在预训练和微调模型上稳定提高了分类性能,而且在训练和推断速度上更加高效,具有更强的内在可解释性。