BriefGPT.xyz
Ask
alpha
关键词
quantized inference
搜索结果 - 1
FBGEMM:实现低精度深度学习推理的高性能技术
本文介绍了 fbgemm 这一高性能的内核库,其使用了深度学习中的浮点数、16 位整数、8 位整数甚至 4 位或 2 位整数等低精度数据类型,但是仍能保证与高精度数据类型相同的准确性,从而使得量化计算变得更加高效。fbgemm 通过 fus
→
PDF
3 years ago
Prev
Next