Nov, 2023

大型语言模型的训练、微调和推理的运行时性能剖析

TL;DR通过针对大型语言模型的预训练、微调和运行时性能进行细致的分析和基准测试,本研究旨在为用户和研究人员提供对于配置选择以及优化性能的不同方法、框架和硬件平台的理解。