Sep, 2023
QuantEase: 基于优化的语言模型量化 -- 一种高效直观的算法
QuantEase: Optimization-based Quantization for Language Models -- An Efficient and Intuitive Algorithm
Kayhan Behdin, Ayan Acharya, Aman Gupta, Sathiya Keerthi, Rahul Mazumder
TL;DR本研究采用 Coordinate Descent(CD)技术,通过 QuantEase 分层量化框架对 Large Language Models(LLMs)进行后训练量化,包括离群值感知算法,以实现近乎 3 位量化并提高模型性能。