Sep, 2022

SAMP:自适应混合精度模型推理工具包

TL;DR本文提出了一种自适应混合精度 (SAMP) 工具包来控制量化率,以平衡效率和性能,可以轻松量化模型进行推理。实验结果表明,SAMP 工具包的加速比优于 PyTorch 和 FasterTransformer,同时保证所需性能。此外,SAMP 基于模块化设计,可无缝集成到 PyTorch 中处理各种下游任务。