Mar, 2019

在嵌入式 ARM big.LITTLE 多核处理器上进行高吞吐量 CNN 推理

TL;DR本文介绍了一种名为 Pipe-it 的替代框架,它采用流水线设计将卷积层分布在多个簇中,从而限制各自卷积内核的并行化,以提高 IoT Edge 智能的推理效率。使用性能预测模型利用卷积层描述符预测各允许的内核配置(类型和数量)上每个卷积层的执行时间,并利用有效的设计空间探索算法来创建平衡的管道,Pipe-it 平均提高了 39%的吞吐量。