May, 2020

SmartExchange: 以低成本计算为代价获取更高成本的存储 / 访问

TL;DRSmartExchange 是一种算法 - 硬件协同设计框架,将高成本的存储 / 访问内存与低成本的计算交换,用于深度神经网络的能量高效推理。该算法通过强制一种特殊的 DNN 权重结构,成功将稀疏化、分解和量化三种主流模型压缩思想集成进一个统一框架中,最终得到的稀疏、易于量化的 DNN 具有极低的能耗和存储空间需求。此外,该研究还设计了一个专用加速器,可充分利用 SmartExchange 所强制的权重,改进深度神经网络的能效和延迟表现。