Nov, 2023
为减少DNN加速器的片外数据访问而结合调度、内存分配和张量替换
Combined Scheduling, Memory Allocation and Tensor Replacement for
Minimizing Off-Chip Data Accesses of DNN Accelerators
TL;DR通过一个名为COSMA的优化框架,我们能够在专用硬件加速器上为DNNs找到最佳的操作调度、内存分配和张量替换方式,从而最小化额外数据访问,同时通过分而治之的启发式方法可以将复杂DNNs的数据访问降低85%以上。