BriefGPT.xyz
大模型
Ask
alpha
关键词
structured compression
搜索结果 - 2
ZipLM:面向硬件感知的语言模型结构化剪枝
该研究提出了一种新的大规模语言模型结构压缩方法 ZipLM,通过迭代的结构缩小模型的权重矩阵,实现在保证一组可行的目标加速比的同时提供最先进的压缩精度结果,并且能够在单次运行中在后训练 / 一次性和渐进压缩设置下生成一组准确的模型,其基于新
→
PDF
a year ago
MM
C-LSTM:利用结构压缩技术在 FPGAs 上实现高效 LSTM
本文提出了一种基于块循环矩阵的压缩方案,用于改善长短时记忆网络的 FPGA 实现效率,并将该方法应用于一个名为 C-LSTM 的综合框架,其精度损失很小。
PDF
6 years ago
Prev
Next