Aug, 2023

共享内存冲突感知的异构片上系统并发DNN执行

TL;DR本研究提出了一种名为HaX-CoNN的新方案,将并发执行的深度神经网络推理工作负载的层映射到系统级芯片内的多种异构加速器,以最小化内存争用并提升工作负载的延迟和总体吞吐量。实验结果表明,与最先进的方法相比,HaX-CoNN可将内存争用降低最多45%,延迟和总体吞吐量分别提高最多32%和29%。