Nov, 2023

AFPQ: 非对称浮点量化用于LLMs

TL;DR通过使用不对称FP量化方法,我们提出了一种改进的量化方法,可以在大语言模型中提高准确性,且无需额外存储空间。