Jun, 2024

具有模型压缩的异构边缘设备上具有容错性的分布式推理

TL;DRRoCoIn是一种用于异构边缘设备上本地分布式执行深度神经网络推断任务的稳健合作推断机制,通过知识蒸馏从大型模型中学习独立而紧凑的学生模型,并以冗余方式部署和执行相同的学生模型以提高推断过程的容错性和系统响应速度。与几种基线方法相比,广泛的模拟验证了我们的RoCoIn在分布式推断中的卓越性能,并证明了其在及时推断和容错能力方面的有效性。