BriefGPT.xyz
Ask
alpha
关键词
outlier-friendly feature knowledge distillation
搜索结果 - 1
TernaryLLM:三值化大型语言模型
应用三值化和离群值友好特征知识蒸馏,我们提出了可学习的双向三值化方法,该方法在大型语言模型上表现优异,超越了其他低位量化方法,并在 C4 数据集上降低了困惑度,并在零样本任务的平均准确率上提高了 8.2%。
PDF
25 days ago
Prev
Next