BriefGPT.xyz
Ask
alpha
关键词
dynamic sparsification
搜索结果 - 1
ACL
探究多语言预训练模型的结构剪枝:设置、算法和效率
本研究评估了基于结构化剪枝在多语言预训练语言模型上的三个方面:设置、算法和效率,并通过在九个下游任务中的实验展示了一些反直觉现象。为了方便各个稀疏度水平上的比较,我们提出了一种简单的方法 —— 动态稀疏化,它可以让模型只需要训练一次就能适应
→
PDF
2 years ago
Prev
Next