May, 2024

LLM-QBench: 大型语言模型后训练量化最佳实践基准测试

TL;DR探索量化大型语言模型的最佳实践,平衡性能与计算效率。通过基准测试和实验,提出了与标定数据、量化算法和量化方案相对应的三个关键点,并构建了最佳的LLM PTQ流水线。