Aug, 2023

共享内存冲突感知的异构片上系统并发 DNN 执行

TL;DR本研究提出了一种名为 HaX-CoNN 的新方案,将并发执行的深度神经网络推理工作负载的层映射到系统级芯片内的多种异构加速器,以最小化内存争用并提升工作负载的延迟和总体吞吐量。实验结果表明,与最先进的方法相比,HaX-CoNN 可将内存争用降低最多 45%,延迟和总体吞吐量分别提高最多 32% 和 29%。