Mar, 2024

EasyQuant: 一种高效无数据量化算法用于LLMs

TL;DR本研究提出了EasyQuant,这是一种训练免费且独立于数据的权重量化算法,旨在实现对大型语言模型(LLMs)的几乎无损量化性能,且算法运行速度比依赖于数据的方法快10倍以上。