Jun, 2024

T-MAC: 通过表查找实现的低位LLM在边缘部署上的CPU复兴

TL;DRT-MAC是一种基于查找表(LUT)的创新方法,用于在CPU上进行高效的低位LLM(即量化权重LLM)推断,并且在同时消除乘法和减少加法的要求方面支持mpGEMM。