Oct, 2023

Sparse-DySta: 稀疏多 DNN 工作负载的稀疏感知动态和静态调度

TL;DR本文系统分析了多个稀疏深度神经网络的使用情况并研究了优化的机会,基于这些研究结果,我们提出了 Dysta,这是一种利用静态和动态稀疏信息进行稀疏多深度神经网络调度的新型双层动态和静态调度器。我们构建了一个公共基准,其中包含了跨移动电话、AR/VR 可穿戴设备和数据中心的不同部署情景的稀疏多深度神经网络工作负载。对稀疏多深度神经网络基准的全面评估表明我们提出的方法在满足延迟限制方面的违规率减少了 10% 左右,并且平均归一化周转时间减少了近 4 倍。我们的工件和代码可公开获取。