Sep, 2023

QuantEase: 基于优化的语言模型量化 -- 一种高效直观的算法

TL;DR本研究采用Coordinate Descent(CD)技术,通过QuantEase分层量化框架对Large Language Models(LLMs)进行后训练量化,包括离群值感知算法,以实现近乎3位量化并提高模型性能。