Nov, 2023

EPIM: 基于 Epitome 的高效处理内存加速器

TL;DR为了解决处理内存加速器上大规模神经网络的受限芯片内存容量所带来的挑战,本文介绍了 Epitome,这是一个轻量级神经算子,为处理内存加速器(EPIM)设计了高效的卷积操作符。实验结果表明,我们的 3 位量化 EPIM-ResNet50 在 ImageNet 上达到了 71.59% 的 top-1 准确率,将交叉栏面积降低了 30.65 倍,超过了 PIM 的最先进修剪方法。