Nov, 2023

稀疏化再分类:从大型语言模型的内部神经元到高效的文本分类器

TL;DR我们的研究提出了一种使用所有内部表示的方法,通过在所有激活和隐藏状态上采用多种池化策略,首先逐层稀疏化特定于任务的特征,然后在层之间进行聚合,用于文本分类。我们的实验证明,STC 不仅在预训练和微调模型上稳定提高了分类性能,而且在训练和推断速度上更加高效,具有更强的内在可解释性。