Dec, 2022

4 位精度的必要性:k 位推断缩放定律

TL;DR研究语言模型在压缩模型时的精度与模型大小之间的平衡,发现在总模型位和零 - shot 准确度方面,{4 位} 精度几乎普遍最优。