Jun, 2024

TernaryLLM:三值化大型语言模型

TL;DR应用三值化和离群值友好特征知识蒸馏,我们提出了可学习的双向三值化方法,该方法在大型语言模型上表现优异,超越了其他低位量化方法,并在 C4 数据集上降低了困惑度,并在零样本任务的平均准确率上提高了 8.2%。