BriefGPT.xyz
大模型
Ask
alpha
关键词
2-, 3-, and 4-bit models
搜索结果 - 1
CVPR
可学习的压缩量化技术用于精确低比特神经网络
本文提出了一种可学习的压缩量化方法 (LCQ), 该方法能够灵活地通过优化模型权重和可学习的压缩函数来控制权重和激活的压缩级别,从而优于传统的最先进方法,并缩小量化模型与全精度模型之间的差距。
PDF
3 years ago
Prev
Next