BriefGPT.xyz
Ask
alpha
关键词
deployment on edge devices
搜索结果 - 1
EMNLP
最优 BERT 外科医生:可扩展和精确的二阶修剪方法,适用于大型语言模型
本文研究了 Transformer-based 语言模型的压缩方法,提出了基于 oBERT 的权重剪枝方法并将其应用在 BERT 模型的训练和 fine-tuning 中,同时利用多种压缩方法得到高压缩模型并在边缘设备上进行了部署。
PDF
2 years ago
Prev
Next