BriefGPT.xyz
Ask
alpha
关键词
math throughput
搜索结果 - 1
加速稀疏深度神经网络
介绍了 NVIDIA Ampere GPU 架构中的稀疏张量核心 (Sparse Tensor Cores),它们利用了 2:4 的稀疏模式,通过两倍的数学吞吐量加速了稠密矩阵单元,并提出了一种简单的工作流程以训练满足 2:4 稀疏模式和保
→
PDF
3 years ago
Prev
Next