Jun, 2024

T-MAC: 通过表查找实现的低位 LLM 在边缘部署上的 CPU 复兴

TL;DRT-MAC 是一种基于查找表(LUT)的创新方法,用于在 CPU 上进行高效的低位 LLM(即量化权重 LLM)推断,并且在同时消除乘法和减少加法的要求方面支持 mpGEMM。