BriefGPT.xyz
大模型
Ask
alpha
关键词
structure pruning
搜索结果 - 2
基于 ReRAM 的 Transformer 语言模型的零空间成本容错技术
本文提出了一种零空间成本的容错机制,通过可微结构修剪、权重复制和投票以及嵌入最显著位(MSBs)到模型权重中,有效减少了硬件故障对模型预测的影响,并通过在 GLUE 基准的九个任务上使用 BERT 模型进行实验验证了该方法的有效性。
PDF
5 months ago
FSCNN: 一种快速的稀疏卷积神经网络推理系统
本文主要介绍了利用大规模稀疏结构提高卷积神经网络推理效率的方法, 开发了一种名为 FSCNN 的稀疏卷积神经网络推理系统,能够在一定的稀疏程度下优于标准深度学习库 PyTorch,但遇到高优化密集运算时推理效率有一定局限性,因此推荐采用粗粒
→
PDF
2 years ago
Prev
Next