BriefGPT.xyz
大模型
Ask
alpha
关键词
automatic compression
搜索结果 - 1
AutoQNN: 一种自动量化神经网络的端到端框架
本文提出一种名为 AutoQNN 的端到端框架,通过引入量化方案搜索(QSS)、量化精度学习(QPL)和量化架构生成(QAG)三种技术,自动实现对不同深度神经网络(DNN)模型的不同层进行不同方案和不同精度的量化,无需人工干预,实现对深度神
→
PDF
a year ago
Prev
Next