BriefGPT.xyz
Ask
alpha
关键词
general matrix multiplication
搜索结果 - 3
非 GEMM 基准:通过非 GEMM 工作负载了解最新机器学习工作负载的性能边界
机器学习 (ML) 运算符是设计具有不同目标应用的 ML 模型的基本构建模块。GEneral Matrix Multiplication (GEMM) 运算符是 ML 模型的基础,但在计算上非常昂贵,因此需要对其进行研究和优化以加快 ML
→
PDF
3 months ago
NeuralMatrix:将整个神经网络转换为通用矩阵乘法以实现高效推断
本研究提出了一种新的框架 NeuralMatrix,可以在一个单一的通用矩阵乘法加速器上计算多功能的深度神经网络,同时在性能和特定应用的加速水平方面与 CPU 和 GPU 等通用处理器相比具有优势。
PDF
a year ago
基于低内存 GEMM 的深度神经网络卷积算法
本文提出两种新型基于 GEMM 的算法,分别只需要额外的 O (MHW) 和 O (KW) 的空间,显著降低了 DNN 卷积的空间开销,适用于内存受限的嵌入式系统,并且实验表明我们的低内存算法和最好的图案构建方法一样快,尽管需要的额外内存只
→
PDF
7 years ago
Prev
Next