Jan, 2021

FBGEMM:实现低精度深度学习推理的高性能技术

TL;DR本文介绍了 fbgemm 这一高性能的内核库,其使用了深度学习中的浮点数、16 位整数、8 位整数甚至 4 位或 2 位整数等低精度数据类型,但是仍能保证与高精度数据类型相同的准确性,从而使得量化计算变得更加高效。fbgemm 通过 fusion、gemm 实现和阶段性的内核代码生成,提高计算效率,实践证明在 Facebook 上已经成为了生产基线的 2 倍以上。