Mar, 2024

面向高效 DNN 推理的分布感知对数 Posit 编码算法硬件协同设计

TL;DR本研究介绍了一种基于对数正数(LP)的自适应、硬件友好的数据类型,通过参数化 LP 位域,动态适应深度神经网络(DNN)的权重 / 激活分布。我们还开发了一种基于遗传算法的 LP 量化(LPQ)框架,通过新颖的全局 - 局部对比目标减小量化与全精度模型之间的表示差异。此外,我们设计了一个统一的混合精度 LP 加速器(LPA)体系架构,其中计算数据路径中的处理元件(PE)采用 LP。我们的算法 - 硬件协同设计在各种 CNN 和 ViT 模型上实现了平均小于 1% 的 top-1 准确率下降,与使用不同数据类型的最先进量化加速器相比,性能单位面积提高了约 2 倍,并提高了 2.2 倍的能源效率。