Aug, 2020

SPINN: 设备和云上神经网络的协同渐进推理

TL;DR本文提出了 SPINN 系统,利用分布式计算和渐进推理方法共同实现设备云协同计算,并引入了一种新的调度程序,通过合理设置早期退出策略和 CNN 分割,以适应动态条件和满足用户定义的服务水平要求,以达到快速和强大的 CNN 推理。定量评估表明,在不同网络条件下,SPINN 的吞吐量高达其最先进的协作推理对手的 2 倍,将服务器成本降低了多达 6.8 倍,并在延迟限制下提高精度 20.7%,同时在不确定的连接条件下提供稳健操作和与云为中心的执行相比显著的节能。