Aug, 2024

超参数对大型语言模型推理性能的影响:vLLM和HuggingFace管道的评估

TL;DR本研究解决了大型语言模型推理性能中的超参数优化问题,通过分析20个大型语言模型在vLLM和HuggingFace管道中的表现。研究发现,超参数对推理吞吐量有显著影响,优化超参数可提升HuggingFace管道的吞吐量,平均分别提高9.16%和13.7%。