May, 2023

产品量化及其硬件加速

TL;DR本文研究了在 DNNs 中将传统的 MAC 操作替换为使用 product quantization 时的计算和内存占用情况,采用不同的 PQ 设置和训练方法,设计了第一个定制的硬件加速器来评估运行 PQ 模型的速度和效率,发现与高度优化的传统 DNN 加速器相比,PQ 配置能够使 ResNet20 的面积性能提高 40% 至 104%,且硬件性能优于近期的 PQ 解决方案 4 倍,只有 0.6% 的精度降低,为 PQ 模型的更广泛采用铺平了道路。