BriefGPT.xyz
Aug, 2020
基于硬件的混合精度量化自动机器学习
Hardware-Centric AutoML for Mixed-Precision Quantization
HTML
PDF
Kuan Wang, Zhijian Liu, Yujun Lin, Ji Lin, Song Han
TL;DR
本文提出了一种基于深度强化学习的硬件感知自动量化框架 (HAQ),旨在为不同的神经网络体系结构和硬件体系结构确定最佳的量化策略,以提高计算效率并在保持准确性的前提下减少延迟和能耗。 在硬件仿真器的帮助下,该框架的有效性已得到证明。
Abstract
model quantization
is a widely used technique to compress and accelerate
deep neural network
(DNN) inference. Emergent DNN hardware accelerators begin to support
→