Sep, 2022

PIM-QAT:面向处理内存系统(PIM)的神经网络量化

TL;DR本研究提出了一种针对处理内存(PIM)量化的方法 (PIM-QAT),通过分析训练动态,引入反向传播和前向传播重缩放技术,提出批归一化(BN)校准和调整精度训练等技术,有效地解决了硬件约束引起的非理想因素,实现了PIM系统中具有可比性的推理精度。