Jul, 2023

INT-FP-QSim:大型语言模型和视觉变换器的混合精度和格式

TL;DR最近大规模语言模型(LLMs)的兴起导致了对降低精度的LLMs的增加,为了解决资源限制和促进民主化进程,我们提出了INT-FP-QSim: 一个开源模拟器,可以在不同的数值精度和格式下灵活评估LLMs和视觉转换器。通过我们的模拟器,我们调查了不同数值格式对4位权重和4位或8位激活的LLMs和视觉转换器性能的影响,并比较了Adaptive Block Floating Point、SmoothQuant、GPTQ和RPTQ等最近提出的方法在模型性能上的表现。我们希望INT-FP-QSim能够使研究人员灵活地模拟不同精度的模型,以支持进一步的LLMs和视觉转换器的量化研究。