Jul, 2023

Miriam:在边缘 GPU 上利用弹性核心进行实时多 DNN 推理

TL;DR提出了 Miriam,一种用于多个边缘 GPU 上的深度神经网络任务协调的计划,通过弹性内核生成器和运行时动态内核协调器,可以实现混合关键性 DNN 推理,并且在关键任务上只产生不到 10%的延迟开销,相比现有技术基准,系统吞吐量可提高 92%。