BriefGPT.xyz
Ask
alpha
关键词
cpu acceleration
搜索结果 - 2
VEGETA:CPU 上用于稀疏 / 密集 GEMM Tile 加速的垂直集成扩展
本文介绍了 VEGETA,它是一组指令集和微架构扩展,可支持 CPU 上的灵活结构稀疏性,并与密集矩阵引擎相结合,以便在各种密度的 DL 模型上进行编程,与现有 CPU 中的 SOTA 引擎相比,它提供了 1.09x, 2.20x, 3.7
→
PDF
a year ago
利用整流器单元的稀疏性加速卷积神经网络
本研究针对深度卷积神经网络中常用的整流线性单元(ReLU),探究其输出的稀疏性质,并借此来加速卷积计算,通过跳过计算零值神经元的方法,相比传统矩阵乘法,当稀疏度不低于 0.9 时,在 CPU 上实现了较大的加速。
PDF
7 years ago
Prev
Next