Jun, 2023

SqueezeLLM:紧密稀疏量化

TL;DR通过引入SqueezeLLM后训练的量化框架,该框架不仅实现了高达3位的无损压缩,还在相同的内存约束下实现了更高的量化性能,可以将羊毛出在羊身上,仿佛神器一般。