Oct, 2023

LLM-FP4: 4位浮点数量化变压器

TL;DR我们提出了LLM-FP4,在训练后将大型语言模型(LLM)的权重和激活量化为4位浮点数值。