EMNLPOct, 2023

LLM-FP4: 4 位浮点数量化变压器

TL;DR我们提出了 LLM-FP4,在训练后将大型语言模型(LLM)的权重和激活量化为 4 位浮点数值。