Apr, 2024

基于深度强化学习的深度神经网络多租户多加速器系统的在线调度策略

TL;DR当前,云服务外包 DNNs 的趋势日益增长。本文介绍了一种针对多租户环境中 DNNs 在线调度的低开销深度强化学习算法 RELMAS,考虑了加速器的数据流异构性和内存带宽竞争问题,提高了服务提供商的硬件利用率并优化了服务水平协议满意率。在包含 Simba 和 Eyeriss 子加速器实例的多异构加速器系统上,与最先进的调度技术相比,在不同工作负载场景下,SLA 满意率提高了 173%,能源开销仅增加了不到 1.5%。