BriefGPT.xyz
Feb, 2025
稀疏内存访问的NVR:在神经处理单元上的向量提前执行
NVR: Vector Runahead on NPUs for Sparse Memory Access
HTML
PDF
Hui Wang, Zhengpeng Zhao, Jing Wang, Yushu Du, Yuan Cheng...
TL;DR
本研究针对深度神经网络中的稀疏性所带来的缓存失效问题,提出了NPU向量提前执行(NVR)机制,以减少缓存失效的影响。NVR采用轻量级的硬件子线程设计,具有高效的性能提升,并实现了相比现有技术平均90%的缓存失效减少,且在稀疏工作负载中提供了4倍的速度提升。
Abstract
Deep Neural Networks
are increasingly leveraging
Sparsity
to reduce the scaling up of model parameter size. However, reducing wall-clock time through
→