ICMLMay, 2024

从学生中学习:应用 t - 分布来探索 LLM 的准确和高效格式

TL;DR使用大规模分析,我们得出结论:大多数分布遵循 t 分布。由此,我们推导出基于该分布的新型格式 -- Student Float(SF4),其相较于 Normal Float(NF4)可提高现代大语言模型的平均准确率。接着,我们提出通过增加两种超正常支持的方式来改进 E2M1 模型,进一步增强其准确率。最后,我们评估了 11 种数据类型的模型准确率和硬件复杂度,并发现 INT4、E2M1 和具有超正常支持的 E2M1 组成了一个帕累托曲线,可在模型准确率和芯片面积之间进行连续权衡,从而在 1.22%的面积开销下将 Phi-2 的准确率提高了高达 2.19%。