Sep, 2022
SAMP:自适应混合精度模型推理工具包
SAMP: A Toolkit for Model Inference with Self-Adaptive Mixed-Precision
Rong Tian, Zijing Zhao, Weijie Liu, Haoyan Liu, Weiquan Mao...
TL;DR本文提出了一种自适应混合精度 (SAMP) 工具包来控制量化率,以平衡效率和性能,可以轻松量化模型进行推理。实验结果表明,SAMP 工具包的加速比优于 PyTorch 和 FasterTransformer,同时保证所需性能。此外,SAMP 基于模块化设计,可无缝集成到 PyTorch 中处理各种下游任务。