Dec, 2022

4位精度的必要性:k位推断缩放定律

TL;DR研究语言模型在压缩模型时的精度与模型大小之间的平衡,发现在总模型位和零-shot准确度方面,{4位}精度几乎普遍最优。