BriefGPT.xyz
大模型
Ask
alpha
关键词
speedup targets
搜索结果 - 1
ZipLM:面向硬件感知的语言模型结构化剪枝
该研究提出了一种新的大规模语言模型结构压缩方法 ZipLM,通过迭代的结构缩小模型的权重矩阵,实现在保证一组可行的目标加速比的同时提供最先进的压缩精度结果,并且能够在单次运行中在后训练 / 一次性和渐进压缩设置下生成一组准确的模型,其基于新
→
PDF
a year ago
Prev
Next