Apr, 2023

DeepGEMM: 使用查找表在 CPU 结构上加速的超低精度推断

TL;DR通过建立查找表并在推理时高效地访问它们,DeepGEMM可以在SIMD硬件上执行超低精度卷积神经网络,比现有框架中的对应8位整数核心性能提高了高达1.74倍。