Jun, 2023

神经网络压缩:二值化和少量全精度权值

TL;DR本论文提出了自动修剪二值化 (APB) 技术,结合量化和修剪,提高二元网络的表示能力,通过将部分全精度权重进行二值化或保留原精度降低其存储,具备更好的精度 / 内存的性价比且在效率方面持续优化。