Apr, 2018

序列标注的语言模型剪枝:高效的上下文表示

TL;DR本研究提出了一种基于稀疏性诱导正则化的层选择方法,用于压缩大型预训练语言模型,以提高特定任务的计算效率,并在两个基准数据集上进行了实验验证其有效性。