Aug, 2023
深度神经网络压缩的量化可知因式分解
Quantization Aware Factorization for Deep Neural Network Compression
Daria Cherniuk, Stanislav Abukhovich, Anh-Huy Phan, Ivan Oseledets, Andrzej Cichocki...
TL;DR使用张量分解和量化相结合的方法,通过交替方向乘数法来压缩神经网络的权重,实现在保持预测质量的同时减少参数和计算量,并展示出与现有后训练量化方法相比的竞争性结果和高灵活性的优势。