BriefGPT.xyz
Sep, 2024
加速边缘设备上的二次幂量化
Accelerating PoT Quantization on Edge Devices
HTML
PDF
Rappy Saha, Jude Haris, José Cano
TL;DR
本研究解决了边缘设备上二次幂(PoT)量化的高效性不足问题。我们设计了基于移位的处理元件(shift-PE)和一个新的开源加速器PoTAcc,旨在提高PoT量化深度神经网络(DNNs)的性能。实验结果显示,PoTAcc在资源受限的边缘设备上相较于传统乘法加速器实现了1.23倍的速度提升和1.24倍的能量降低。
Abstract
Non-uniform
Quantization
, such as power-of-two (PoT)
Quantization
, matches data distributions better than uniform
Quantization
, which redu
→