Sep, 2023

QuantEase: 基于优化的语言模型量化 -- 一种高效直观的算法

TL;DR本研究采用 Coordinate Descent(CD)技术,通过 QuantEase 分层量化框架对 Large Language Models(LLMs)进行后训练量化,包括离群值感知算法,以实现近乎 3 位量化并提高模型性能。