BriefGPT.xyz
Ask
alpha
关键词
unstructured sparsity
搜索结果 - 3
Flash-LLM:使用非结构稀疏性实现成本效益高且高效的大型生成模型推断
Flash-LLM 是一种针对大型生成模型的低成本高效大规模推断框架,通过优化稀疏矩阵乘法,在高性能 Tensor Cores 上实现了显著的性能提升。
PDF
10 months ago
N:M 稀疏性的空间重参数化
本文提出了 Spatial Re-parameterization (SpRe) 方法,用于 N:M 稀疏性在 CNN 中的应用。该方法可以在训练期间利用非结构化稀疏性的空间稀疏性分布来为 N:M 稀疏性模型分配一个额外的支路,使其可以维持
→
PDF
a year ago
ICML
可学习稀疏度的软阈值权重重参数化
本研究提出了一种基于软阈值重参数化(STR)的方法,该方法通过学习修剪阈值实现平滑稀疏(非均匀稀疏),从而获得非均匀稀疏预算,进而在 CNNs 中实现非结构化稀疏,在 ImageNet-1K 上实现了最先进的准确性,并且可以用于在 RNNs
→
PDF
4 years ago
Prev
Next