Feb, 2025

稀疏内存访问的NVR:在神经处理单元上的向量提前执行

TL;DR本研究针对深度神经网络中的稀疏性所带来的缓存失效问题,提出了NPU向量提前执行(NVR)机制,以减少缓存失效的影响。NVR采用轻量级的硬件子线程设计,具有高效的性能提升,并实现了相比现有技术平均90%的缓存失效减少,且在稀疏工作负载中提供了4倍的速度提升。