BriefGPT.xyz
Ask
alpha
关键词
inference time acceleration
搜索结果 - 1
用于快速模型推理的神经网络压缩框架
该论文提出了一个新的神经网络压缩框架 NNCF,它基于当前各种网络压缩方法进行改进,如稀疏化、量化和二值化。这些方法可以加速推理时间,同时保持原有的准确性。NNCF 可作为训练样本或单独的软件包供使用,并且可以无缝地集成到现有的训练代码中。
PDF
4 years ago
Prev
Next