Feb, 2020

用于快速模型推理的神经网络压缩框架

TL;DR该论文提出了一个新的神经网络压缩框架 NNCF,它基于当前各种网络压缩方法进行改进,如稀疏化、量化和二值化。这些方法可以加速推理时间,同时保持原有的准确性。NNCF 可作为训练样本或单独的软件包供使用,并且可以无缝地集成到现有的训练代码中。