Apr, 2023

AutoQNN: 一种自动量化神经网络的端到端框架

TL;DR本文提出一种名为 AutoQNN 的端到端框架,通过引入量化方案搜索(QSS)、量化精度学习(QPL)和量化架构生成(QAG)三种技术,自动实现对不同深度神经网络(DNN)模型的不同层进行不同方案和不同精度的量化,无需人工干预,实现对深度神经网络的自动量化。实验表明,AutoQNN 相对于现有的量化算法在准确性和效率上都表现得更优秀。