BriefGPT.xyz
Ask
alpha
关键词
module collaboration
搜索结果 - 1
重新审视脱机压缩:超越基于分解的方法,针对 Transformer 语言模型
本篇文章旨在探讨离线压缩方法,并提出了一种基于自编码器的新框架,旨在压缩 transformer 语言模型。实验证明,启用模块间的协作并使用所提出的方法能够显著提高模型性能。
PDF
a year ago
Prev
Next