Jul, 2023

INT-FP-QSim:大型语言模型和视觉变换器的混合精度和格式

TL;DR最近大规模语言模型 (LLMs) 的兴起导致了对降低精度的 LLMs 的增加,为了解决资源限制和促进民主化进程,我们提出了 INT-FP-QSim: 一个开源模拟器,可以在不同的数值精度和格式下灵活评估 LLMs 和视觉转换器。通过我们的模拟器,我们调查了不同数值格式对 4 位权重和 4 位或 8 位激活的 LLMs 和视觉转换器性能的影响,并比较了 Adaptive Block Floating Point、SmoothQuant、GPTQ 和 RPTQ 等最近提出的方法在模型性能上的表现。我们希望 INT-FP-QSim 能够使研究人员灵活地模拟不同精度的模型,以支持进一步的 LLMs 和视觉转换器的量化研究。