Aug, 2023

NUPES: 非均匀后训练量化算法的功率指数搜索

TL;DR通过非均匀量化和自同构的方法,优化了深度神经网络的量化问题,实现了整数位低比特推断,并在无数据和有数据两种配置下,实现了最先进的压缩率。